spacy: إضافة lemmatizer lookup للغة الهولندية (nl)

أستخدم تطبيق Spacy 2.0.11 باستخدام نموذج اللغة الهولندية nl_core_news_sm (nl). كيف يمكنني إضافة البحث عن اللمث المشابه لتطبيق الألمانية (de)؟

لقد جربت الخطوات التالية:

  • أضف بحثًا إلى init .py في مجلد اللغة (nl)
  • أضف lemmatizer.py في مجلد اللغة (nl)

نتج عن هذا الخطأ التالي بعد 'nlp = nl_core_news_sm.load ()' أو 'من spacy.lang.nl import Dutch':

ModuleNotFoundError: لا وحدة نمطية باسم "spacy.lang.nl.lemmatizer" ImportError: [E048] لا يمكن استيراد لغة nl من spacy.lang

0

2 إجابة

نظريًا ، يكون أسلوبك صحيحًا - إذا قمت بنسخ كيفية تنفيذه باللغة الألمانية واللغات الأخرى التي تقوم بتنفيذ البحث ، يجب أن تعمل.

أظن أن مشكلتك هنا هي في الواقع مختلفة: وفقا لرسالة الخطأ ، فإنه لا يمكن في الواقع العثور على وحدة spacy.lang.nl.lemmatizer ، لذلك spaCy الآن فشل في استيراد اللغة الهولندية . هل أنت متأكد من وجود ملف lemmatizer.py في المكان الصحيح ، ويتم استيراده بشكل صحيح؟ (إذا كنت لا تفعل ذلك بالفعل ، فأنا أوصي أيضًا بتشغيل تثبيت التطوير الخاص بك في بيئة منفصلة وبناء spa من المصدر ، للتأكد من عدم وجود صراعات غريبة).

0
وأضاف

أخشى أن ذلك غير ممكن ، يتضمن النموذج الإنجليزي lemmatizer (راجع هنا ) والعلامة الهولندية لا ( هنا ).

هو مكون مكتوب بخط اليد على أساس التشكل للغة ، لذلك في حين أن Spacy لديها نماذج للهولندية هذه الوظيفة المحددة ليست هناك.

0
وأضاف