Skip to content

Commit

Permalink
Fixed Arabic and Kurdish language codes.
Browse files Browse the repository at this point in the history
- ar is now ar_AE (United Arab Emirates).
- ku_TR is now ckb_IQ (Central Kurdish (Iraq)/Sorani Kurdish).
  • Loading branch information
Donatello-za committed Feb 18, 2020
1 parent bd051af commit 98c5359
Show file tree
Hide file tree
Showing 8 changed files with 301 additions and 139 deletions.
6 changes: 3 additions & 3 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -39,18 +39,18 @@ This particular package intends to include the following benefits over the origi
* Polish/język polski (pl_PL)
* Russian/русский язык (ru_RU)
* Brazilian Portuguese/português do Brasil (pt_BR)
* Kurdish/کوردی (ku_TR)
* Sorani Kurdish/سۆرانی (ckb_IQ)

## Version

v1.0.11
v1.0.12

## Special Thanks

* [Jarosław Wasilewski](https://github.com/Orajo): Polish language and improving multi-byte support.
* [Lev Morozov](https://github.com/levmorozov): French and Russian languages.
* [Igor Carvalho](https://github.com/Carvlho): Brazilian Portuguese language.
* [Khoshbin Ali Ahmed](https://github.com/Xoshbin): Kurdish and Arabic languages.
* [Khoshbin Ali Ahmed](https://github.com/Xoshbin): Sorani Kurdish and Arabic languages.

## Installation

Expand Down
1 change: 0 additions & 1 deletion lang/ar.pattern

This file was deleted.

12 changes: 0 additions & 12 deletions lang/ar.php

This file was deleted.

1 change: 1 addition & 0 deletions lang/ar_AE.pattern
Original file line number Diff line number Diff line change
@@ -0,0 +1 @@
/\bيوم\b|\bيمكن\b|\bيكون\b|\bوهي\b|\bوهو\b|\bومن\b|\bولم\b|\bولا\b|\bوكانت\b|\bوكان\b|\bوقف\b|\bوقد\b|\bوقالت\b|\bوقال\b|\bوفي\b|\bواوضح\b|\bوان\b|\bواكد\b|\bواضافت\b|\bواضاف\b|\bواحد\b|\bو(?!(-|'))\b|\bهي\b|\bهو\b|\bهناك\b|\bهذه\b|\bهذا\b|\bنهاية\b|\bنفسه\b|\bنحو\b|\bمنها\b|\bمنذ\b|\bمن\b|\bمليون\b|\bمليار\b|\bمقابل\b|\bمع\b|\bمساء\b|\bمايو\b|\bما\b|\bلوكالة\b|\bلها\b|\bله\b|\bلن\b|\bلم\b|\bللامم\b|\bلكن\b|\bلقاء\b|\bلدى\b|\bلا\b|\bكما\b|\bكلم\b|\bكل\b|\bكانت\b|\bكان\b|\bقوة\b|\bقد\b|\bقبل\b|\bقال\b|\bفيها\b|\bفيه\b|\bفى\b|\bفي\b|\bفان\b|\bف(?!(-|'))\b|\bغير\b|\bغدا\b|\bعندما\b|\bعند\b|\bعن\b|\bعليها\b|\bعليه\b|\bعلى\b|\bعشرة\b|\bعشر\b|\bعدم\b|\bعدد\b|\bعدة\b|\bعاما\b|\bعام\b|\bضمن\b|\bضد\b|\bصفر\b|\bصباح\b|\bشخصا\b|\bسنوات\b|\bسنة\b|\bزيارة\b|\bذلك\b|\bدون\b|\bخلال\b|\bحين\b|\bحيث\b|\bحول\b|\bحوالى\b|\bحتى\b|\bحاليا\b|\bجميع\b|\bثم\b|\bثلاثة\b|\bتم\b|\bبين\b|\bبها\b|\bبه\b|\bبن\b|\bبعض\b|\bبعد\b|\bبشكل\b|\bبسبب\b|\bبرس\b|\bبان\b|\bباسم\b|\bب(?!(-|'))\b|\bايضا\b|\bايام\b|\bايار\b|\bاي\b|\bاول\b|\bاو\b|\bانها\b|\bانه\b|\bان\b|\bامس\b|\bامام\b|\bاما\b|\bاليوم\b|\bالى\b|\bالوقت\b|\bالمقبل\b|\bالماضي\b|\bالف\b|\bالسابق\b|\bالذين\b|\bالذى\b|\bالذي\b|\bالذاتي\b|\bالثانية\b|\bالثاني\b|\bالتى\b|\bالتي\b|\bالاولى\b|\bالاول\b|\bالان\b|\bالاخيرة\b|\bالا\b|\bاكد\b|\bاكثر\b|\bاف\b|\bاعلنت\b|\bاعادة\b|\bاطار\b|\bاربعة\b|\bاذا\b|\bاخرى\b|\bاحد\b|\bاجل\b|\bاثر\b|\bا(?!(-|'))\b|\bأ(?!(-|'))\b|\bـ(?!(-|'))\b|\b،(?!(-|'))\b|\b (?!(-|'))\b/i
174 changes: 174 additions & 0 deletions lang/ar_AE.php
Original file line number Diff line number Diff line change
@@ -0,0 +1,174 @@
<?php

/**
* Stopwords list for the use in the PHP package rake-php-plus.
* See: https://github.com/Donatello-za/rake-php-plus
*
* Extracted using extractor.php @ 2020-02-18T18:55:53+00:00
*/

return [
'يوم',
'يمكن',
'يكون',
'وهي',
'وهو',
'ومن',
'ولم',
'ولا',
'وكانت',
'وكان',
'وقف',
'وقد',
'وقالت',
'وقال',
'وفي',
'واوضح',
'وان',
'واكد',
'واضافت',
'واضاف',
'واحد',
'و',
'هي',
'هو',
'هناك',
'هذه',
'هذا',
'نهاية',
'نفسه',
'نحو',
'منها',
'منذ',
'من',
'مليون',
'مليار',
'مقابل',
'مع',
'مساء',
'مايو',
'ما',
'لوكالة',
'لها',
'له',
'لن',
'لم',
'للامم',
'لكن',
'لقاء',
'لدى',
'لا',
'كما',
'كلم',
'كل',
'كانت',
'كان',
'قوة',
'قد',
'قبل',
'قال',
'فيها',
'فيه',
'فى',
'في',
'فان',
'ف',
'غير',
'غدا',
'عندما',
'عند',
'عن',
'عليها',
'عليه',
'على',
'عشرة',
'عشر',
'عدم',
'عدد',
'عدة',
'عاما',
'عام',
'ضمن',
'ضد',
'صفر',
'صباح',
'شخصا',
'سنوات',
'سنة',
'زيارة',
'ذلك',
'دون',
'خلال',
'حين',
'حيث',
'حول',
'حوالى',
'حتى',
'حاليا',
'جميع',
'ثم',
'ثلاثة',
'تم',
'بين',
'بها',
'به',
'بن',
'بعض',
'بعد',
'بشكل',
'بسبب',
'برس',
'بان',
'باسم',
'ب',
'ايضا',
'ايام',
'ايار',
'اي',
'اول',
'او',
'انها',
'انه',
'ان',
'امس',
'امام',
'اما',
'اليوم',
'الى',
'الوقت',
'المقبل',
'الماضي',
'الف',
'السابق',
'الذين',
'الذى',
'الذي',
'الذاتي',
'الثانية',
'الثاني',
'التى',
'التي',
'الاولى',
'الاول',
'الان',
'الاخيرة',
'الا',
'اكد',
'اكثر',
'اف',
'اعلنت',
'اعادة',
'اطار',
'اربعة',
'اذا',
'اخرى',
'احد',
'اجل',
'اثر',
'ا',
'أ',
'ـ',
'،',
' '
];

1 change: 1 addition & 0 deletions lang/ckb_IQ.pattern
Original file line number Diff line number Diff line change
@@ -0,0 +1 @@
/\b،(?!(-|'))\b|\b؛(?!(-|'))\b|\bیەکەم\b|\bیەک\b|\bیه‌ك\b|\bیانزه‌\b|\bیان\b|\bیارمەتی\b|\bهێنان\b|\bهێشتنەوە\b|\bهێشتا\b|\bهیوا\b|\bهیچیان\b|\bهەیە\b|\bهەوڵ\b|\bهەواڵ\b|\bهەندێک\b|\bهەمووی\b|\bهەمووکەس\b|\bهەموو\b|\bهەڵگرتن\b|\bهەشت\b|\bهەست\b|\bهەریەک\b|\bهەروەها\b|\bهەرگیز\b|\bهەرکەس\b|\bهەرکوێ\b|\bهەرکات\b|\bهەردەم\b|\bهەردووک\b|\bهەردوو\b|\bهەرچییەک\b|\bهەرچەندە\b|\bهەرچۆنێک\b|\bهەرچۆن\b|\bهەر\b|\bهەتاکوو\b|\bهەتاکو\b|\bهەتا\b|\bهه‌شتا\b|\bهه‌شت\b|\bهه‌ژده‌\b|\bهه‌زار\b|\bهات\b|\bوەک\b|\bوەرە\b|\bوە\b|\bووتی\b|\bواتا\b|\bو(?!(-|'))\b|\bنێوان\b|\bنێردرا\b|\bنیگەرانی\b|\bنەیکرد\b|\bنەکردن\b|\bنەخێر\b|\bنه‌وه‌د\b|\bنۆزده‌\b|\bنۆ\b|\bنوێ\b|\bنموونە\b|\bنزیکەیی\b|\bنزیک\b|\bنرخ\b|\bناو\b|\bناشرین\b|\bناتوانێت\b|\bمن\b|\bملیۆن\b|\bملیار\b|\bمانا\b|\bلێرەوە\b|\bلەوانەیە\b|\bلەناو\b|\bلەلایەن\b|\bلەگەڵ\b|\bلەگەل\b|\bلەکوێ\b|\bلەسەر\b|\bلەبەر\b|\bلەبر\b|\bلە\b|\bگۆڕانکارت\b|\bگشتی\b|\bکێ\b|\bکەی\b|\bکەمێک\b|\bکەمترین\b|\bکەمتر\b|\bکەم\b|\bکەسێک\b|\bکەس\b|\bکۆن\b|\bکۆ\b|\bکوێ\b|\bکردی\b|\bکردن\b|\bکاتێک\b|\bکاتی\b|\bفەرمی\b|\bشەش\b|\bشه‌ش\b|\bشه‌ست\b|\bشتێک\b|\bشانزه‌\b|\bسێیەم\b|\bسێ\b|\bسیانزه‌\b|\bسی\b|\bسەیرکردن\b|\bسەیر\b|\bسەروو\b|\bسەر\b|\bسه‌د\b|\bسوپاس\b|\bسڵاو\b|\bسفر\b|\bژێر\b|\bزیاتر\b|\bزۆرتر\b|\bزۆر\b|\bزانین\b|\bڕێیپێدەدا\b|\bڕێز\b|\bڕێپێدان\b|\bڕۆیشت\b|\bڕوونی\b|\bڕوونکردنەوە\b|\bڕاستییەکەی\b|\bڕاستی\b|\bڕاست\b|\bدەور\b|\bدەرەوە\b|\bدەرکەوت\b|\bدەربارە\b|\bدەتوانێت\b|\bدەبێت\b|\bدووەم\b|\bدوور\b|\bدووبارە\b|\bدووان\b|\bدوو\b|\bدوایین\b|\bدوایکەوت\b|\bدوای\b|\bدوانزه‌\b|\bدوان\b|\bدوامکەوە\b|\bدواکەوتن\b|\bدواتر\b|\bدڵنیایی\b|\bدڵنیا\b|\bداخ\b|\bخێرا\b|\bخۆی\b|\bخۆمان\b|\bخۆم\b|\bخۆزگە\b|\bخۆت\b|\bخوار\b|\bحەوت\b|\bحه‌وت\b|\bحه‌ڤده‌\b|\bحه‌فتا\b|\bچی\b|\bچۆن\b|\bچوارەم\b|\bچوارده‌\b|\bچوار\b|\bجیاواز\b|\bجیا\b|\bجل\b|\bجگە\b|\bجار\b|\bتەواو\b|\bتەنیشت\b|\bتەنیا\b|\bتەنانەت\b|\bتۆ\b|\bتوانی\b|\bتکایە\b|\bترلیۆن\b|\bتر\b|\bتایبەتی\b|\bتایبەت\b|\bتاکو\b|\bتا\b|\bپێویستی\b|\bپێویست\b|\bپێنجەم\b|\bپێنج\b|\bپێکەوە\b|\bپێکهاتە\b|\bپێکهاتووە\b|\bپێشتر\b|\bپێش\b|\bپێدان\b|\bپەنا\b|\bپه‌نجا\b|\bپشت\b|\bپرسیار\b|\bپانزه‌\b|\bبینین\b|\bبینی\b|\bبیست\b|\bبیر\b|\bبیبە\b|\bبەڵێ\b|\bبەڵام\b|\bبەس\b|\bبەرەوە\b|\bبەردەوام\b|\bبەرامبەر\b|\bبەخێرهاتن\b|\bبەپێی\b|\bبەبێ\b|\bبۆ\b|\bبوون\b|\bبوو\b|\bبڵێ\b|\bبلیۆن\b|\bبڕۆ\b|\bبردن\b|\bببورە\b|\bباوەڕ\b|\bباشترین\b|\bباشتر\b|\bا(?!(-|'))\b|\bئێوە\b|\bئێمە\b|\bئێستا\b|\bئێرە\b|\bئەیهێنێت\b|\bئەیکات\b|\bئەیزانێت\b|\bئەیدات\b|\bئەوانە\b|\bئەوان\b|\bئەو\b|\bئەڵێت\b|\bئەڵێ\b|\bئەگەر\b|\bئەڕۆین\b|\bئەڕوات\b|\bئەبێت\b|\b (?!(-|'))\b|\b٩(?!(-|'))\b|\b٨(?!(-|'))\b|\b٧(?!(-|'))\b|\b٦(?!(-|'))\b|\b٥(?!(-|'))\b|\b٤(?!(-|'))\b|\b٣(?!(-|'))\b|\b٢(?!(-|'))\b|\b١(?!(-|'))\b|\b٠(?!(-|'))\b/i
Loading

0 comments on commit 98c5359

Please sign in to comment.