-
Notifications
You must be signed in to change notification settings - Fork 49
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Fixed Arabic and Kurdish language codes.
- ar is now ar_AE (United Arab Emirates). - ku_TR is now ckb_IQ (Central Kurdish (Iraq)/Sorani Kurdish).
- Loading branch information
1 parent
bd051af
commit 98c5359
Showing
8 changed files
with
301 additions
and
139 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file was deleted.
Oops, something went wrong.
This file was deleted.
Oops, something went wrong.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1 @@ | ||
/\bيوم\b|\bيمكن\b|\bيكون\b|\bوهي\b|\bوهو\b|\bومن\b|\bولم\b|\bولا\b|\bوكانت\b|\bوكان\b|\bوقف\b|\bوقد\b|\bوقالت\b|\bوقال\b|\bوفي\b|\bواوضح\b|\bوان\b|\bواكد\b|\bواضافت\b|\bواضاف\b|\bواحد\b|\bو(?!(-|'))\b|\bهي\b|\bهو\b|\bهناك\b|\bهذه\b|\bهذا\b|\bنهاية\b|\bنفسه\b|\bنحو\b|\bمنها\b|\bمنذ\b|\bمن\b|\bمليون\b|\bمليار\b|\bمقابل\b|\bمع\b|\bمساء\b|\bمايو\b|\bما\b|\bلوكالة\b|\bلها\b|\bله\b|\bلن\b|\bلم\b|\bللامم\b|\bلكن\b|\bلقاء\b|\bلدى\b|\bلا\b|\bكما\b|\bكلم\b|\bكل\b|\bكانت\b|\bكان\b|\bقوة\b|\bقد\b|\bقبل\b|\bقال\b|\bفيها\b|\bفيه\b|\bفى\b|\bفي\b|\bفان\b|\bف(?!(-|'))\b|\bغير\b|\bغدا\b|\bعندما\b|\bعند\b|\bعن\b|\bعليها\b|\bعليه\b|\bعلى\b|\bعشرة\b|\bعشر\b|\bعدم\b|\bعدد\b|\bعدة\b|\bعاما\b|\bعام\b|\bضمن\b|\bضد\b|\bصفر\b|\bصباح\b|\bشخصا\b|\bسنوات\b|\bسنة\b|\bزيارة\b|\bذلك\b|\bدون\b|\bخلال\b|\bحين\b|\bحيث\b|\bحول\b|\bحوالى\b|\bحتى\b|\bحاليا\b|\bجميع\b|\bثم\b|\bثلاثة\b|\bتم\b|\bبين\b|\bبها\b|\bبه\b|\bبن\b|\bبعض\b|\bبعد\b|\bبشكل\b|\bبسبب\b|\bبرس\b|\bبان\b|\bباسم\b|\bب(?!(-|'))\b|\bايضا\b|\bايام\b|\bايار\b|\bاي\b|\bاول\b|\bاو\b|\bانها\b|\bانه\b|\bان\b|\bامس\b|\bامام\b|\bاما\b|\bاليوم\b|\bالى\b|\bالوقت\b|\bالمقبل\b|\bالماضي\b|\bالف\b|\bالسابق\b|\bالذين\b|\bالذى\b|\bالذي\b|\bالذاتي\b|\bالثانية\b|\bالثاني\b|\bالتى\b|\bالتي\b|\bالاولى\b|\bالاول\b|\bالان\b|\bالاخيرة\b|\bالا\b|\bاكد\b|\bاكثر\b|\bاف\b|\bاعلنت\b|\bاعادة\b|\bاطار\b|\bاربعة\b|\bاذا\b|\bاخرى\b|\bاحد\b|\bاجل\b|\bاثر\b|\bا(?!(-|'))\b|\bأ(?!(-|'))\b|\bـ(?!(-|'))\b|\b،(?!(-|'))\b|\b (?!(-|'))\b/i |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,174 @@ | ||
<?php | ||
|
||
/** | ||
* Stopwords list for the use in the PHP package rake-php-plus. | ||
* See: https://github.com/Donatello-za/rake-php-plus | ||
* | ||
* Extracted using extractor.php @ 2020-02-18T18:55:53+00:00 | ||
*/ | ||
|
||
return [ | ||
'يوم', | ||
'يمكن', | ||
'يكون', | ||
'وهي', | ||
'وهو', | ||
'ومن', | ||
'ولم', | ||
'ولا', | ||
'وكانت', | ||
'وكان', | ||
'وقف', | ||
'وقد', | ||
'وقالت', | ||
'وقال', | ||
'وفي', | ||
'واوضح', | ||
'وان', | ||
'واكد', | ||
'واضافت', | ||
'واضاف', | ||
'واحد', | ||
'و', | ||
'هي', | ||
'هو', | ||
'هناك', | ||
'هذه', | ||
'هذا', | ||
'نهاية', | ||
'نفسه', | ||
'نحو', | ||
'منها', | ||
'منذ', | ||
'من', | ||
'مليون', | ||
'مليار', | ||
'مقابل', | ||
'مع', | ||
'مساء', | ||
'مايو', | ||
'ما', | ||
'لوكالة', | ||
'لها', | ||
'له', | ||
'لن', | ||
'لم', | ||
'للامم', | ||
'لكن', | ||
'لقاء', | ||
'لدى', | ||
'لا', | ||
'كما', | ||
'كلم', | ||
'كل', | ||
'كانت', | ||
'كان', | ||
'قوة', | ||
'قد', | ||
'قبل', | ||
'قال', | ||
'فيها', | ||
'فيه', | ||
'فى', | ||
'في', | ||
'فان', | ||
'ف', | ||
'غير', | ||
'غدا', | ||
'عندما', | ||
'عند', | ||
'عن', | ||
'عليها', | ||
'عليه', | ||
'على', | ||
'عشرة', | ||
'عشر', | ||
'عدم', | ||
'عدد', | ||
'عدة', | ||
'عاما', | ||
'عام', | ||
'ضمن', | ||
'ضد', | ||
'صفر', | ||
'صباح', | ||
'شخصا', | ||
'سنوات', | ||
'سنة', | ||
'زيارة', | ||
'ذلك', | ||
'دون', | ||
'خلال', | ||
'حين', | ||
'حيث', | ||
'حول', | ||
'حوالى', | ||
'حتى', | ||
'حاليا', | ||
'جميع', | ||
'ثم', | ||
'ثلاثة', | ||
'تم', | ||
'بين', | ||
'بها', | ||
'به', | ||
'بن', | ||
'بعض', | ||
'بعد', | ||
'بشكل', | ||
'بسبب', | ||
'برس', | ||
'بان', | ||
'باسم', | ||
'ب', | ||
'ايضا', | ||
'ايام', | ||
'ايار', | ||
'اي', | ||
'اول', | ||
'او', | ||
'انها', | ||
'انه', | ||
'ان', | ||
'امس', | ||
'امام', | ||
'اما', | ||
'اليوم', | ||
'الى', | ||
'الوقت', | ||
'المقبل', | ||
'الماضي', | ||
'الف', | ||
'السابق', | ||
'الذين', | ||
'الذى', | ||
'الذي', | ||
'الذاتي', | ||
'الثانية', | ||
'الثاني', | ||
'التى', | ||
'التي', | ||
'الاولى', | ||
'الاول', | ||
'الان', | ||
'الاخيرة', | ||
'الا', | ||
'اكد', | ||
'اكثر', | ||
'اف', | ||
'اعلنت', | ||
'اعادة', | ||
'اطار', | ||
'اربعة', | ||
'اذا', | ||
'اخرى', | ||
'احد', | ||
'اجل', | ||
'اثر', | ||
'ا', | ||
'أ', | ||
'ـ', | ||
'،', | ||
' ' | ||
]; | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1 @@ | ||
/\b،(?!(-|'))\b|\b؛(?!(-|'))\b|\bیەکەم\b|\bیەک\b|\bیهك\b|\bیانزه\b|\bیان\b|\bیارمەتی\b|\bهێنان\b|\bهێشتنەوە\b|\bهێشتا\b|\bهیوا\b|\bهیچیان\b|\bهەیە\b|\bهەوڵ\b|\bهەواڵ\b|\bهەندێک\b|\bهەمووی\b|\bهەمووکەس\b|\bهەموو\b|\bهەڵگرتن\b|\bهەشت\b|\bهەست\b|\bهەریەک\b|\bهەروەها\b|\bهەرگیز\b|\bهەرکەس\b|\bهەرکوێ\b|\bهەرکات\b|\bهەردەم\b|\bهەردووک\b|\bهەردوو\b|\bهەرچییەک\b|\bهەرچەندە\b|\bهەرچۆنێک\b|\bهەرچۆن\b|\bهەر\b|\bهەتاکوو\b|\bهەتاکو\b|\bهەتا\b|\bههشتا\b|\bههشت\b|\bههژده\b|\bههزار\b|\bهات\b|\bوەک\b|\bوەرە\b|\bوە\b|\bووتی\b|\bواتا\b|\bو(?!(-|'))\b|\bنێوان\b|\bنێردرا\b|\bنیگەرانی\b|\bنەیکرد\b|\bنەکردن\b|\bنەخێر\b|\bنهوهد\b|\bنۆزده\b|\bنۆ\b|\bنوێ\b|\bنموونە\b|\bنزیکەیی\b|\bنزیک\b|\bنرخ\b|\bناو\b|\bناشرین\b|\bناتوانێت\b|\bمن\b|\bملیۆن\b|\bملیار\b|\bمانا\b|\bلێرەوە\b|\bلەوانەیە\b|\bلەناو\b|\bلەلایەن\b|\bلەگەڵ\b|\bلەگەل\b|\bلەکوێ\b|\bلەسەر\b|\bلەبەر\b|\bلەبر\b|\bلە\b|\bگۆڕانکارت\b|\bگشتی\b|\bکێ\b|\bکەی\b|\bکەمێک\b|\bکەمترین\b|\bکەمتر\b|\bکەم\b|\bکەسێک\b|\bکەس\b|\bکۆن\b|\bکۆ\b|\bکوێ\b|\bکردی\b|\bکردن\b|\bکاتێک\b|\bکاتی\b|\bفەرمی\b|\bشەش\b|\bشهش\b|\bشهست\b|\bشتێک\b|\bشانزه\b|\bسێیەم\b|\bسێ\b|\bسیانزه\b|\bسی\b|\bسەیرکردن\b|\bسەیر\b|\bسەروو\b|\bسەر\b|\bسهد\b|\bسوپاس\b|\bسڵاو\b|\bسفر\b|\bژێر\b|\bزیاتر\b|\bزۆرتر\b|\bزۆر\b|\bزانین\b|\bڕێیپێدەدا\b|\bڕێز\b|\bڕێپێدان\b|\bڕۆیشت\b|\bڕوونی\b|\bڕوونکردنەوە\b|\bڕاستییەکەی\b|\bڕاستی\b|\bڕاست\b|\bدەور\b|\bدەرەوە\b|\bدەرکەوت\b|\bدەربارە\b|\bدەتوانێت\b|\bدەبێت\b|\bدووەم\b|\bدوور\b|\bدووبارە\b|\bدووان\b|\bدوو\b|\bدوایین\b|\bدوایکەوت\b|\bدوای\b|\bدوانزه\b|\bدوان\b|\bدوامکەوە\b|\bدواکەوتن\b|\bدواتر\b|\bدڵنیایی\b|\bدڵنیا\b|\bداخ\b|\bخێرا\b|\bخۆی\b|\bخۆمان\b|\bخۆم\b|\bخۆزگە\b|\bخۆت\b|\bخوار\b|\bحەوت\b|\bحهوت\b|\bحهڤده\b|\bحهفتا\b|\bچی\b|\bچۆن\b|\bچوارەم\b|\bچوارده\b|\bچوار\b|\bجیاواز\b|\bجیا\b|\bجل\b|\bجگە\b|\bجار\b|\bتەواو\b|\bتەنیشت\b|\bتەنیا\b|\bتەنانەت\b|\bتۆ\b|\bتوانی\b|\bتکایە\b|\bترلیۆن\b|\bتر\b|\bتایبەتی\b|\bتایبەت\b|\bتاکو\b|\bتا\b|\bپێویستی\b|\bپێویست\b|\bپێنجەم\b|\bپێنج\b|\bپێکەوە\b|\bپێکهاتە\b|\bپێکهاتووە\b|\bپێشتر\b|\bپێش\b|\bپێدان\b|\bپەنا\b|\bپهنجا\b|\bپشت\b|\bپرسیار\b|\bپانزه\b|\bبینین\b|\bبینی\b|\bبیست\b|\bبیر\b|\bبیبە\b|\bبەڵێ\b|\bبەڵام\b|\bبەس\b|\bبەرەوە\b|\bبەردەوام\b|\bبەرامبەر\b|\bبەخێرهاتن\b|\bبەپێی\b|\bبەبێ\b|\bبۆ\b|\bبوون\b|\bبوو\b|\bبڵێ\b|\bبلیۆن\b|\bبڕۆ\b|\bبردن\b|\bببورە\b|\bباوەڕ\b|\bباشترین\b|\bباشتر\b|\bا(?!(-|'))\b|\bئێوە\b|\bئێمە\b|\bئێستا\b|\bئێرە\b|\bئەیهێنێت\b|\bئەیکات\b|\bئەیزانێت\b|\bئەیدات\b|\bئەوانە\b|\bئەوان\b|\bئەو\b|\bئەڵێت\b|\bئەڵێ\b|\bئەگەر\b|\bئەڕۆین\b|\bئەڕوات\b|\bئەبێت\b|\b (?!(-|'))\b|\b٩(?!(-|'))\b|\b٨(?!(-|'))\b|\b٧(?!(-|'))\b|\b٦(?!(-|'))\b|\b٥(?!(-|'))\b|\b٤(?!(-|'))\b|\b٣(?!(-|'))\b|\b٢(?!(-|'))\b|\b١(?!(-|'))\b|\b٠(?!(-|'))\b/i |
Oops, something went wrong.