قاموس هوشمند نور؛ ساماندهی نوین مداخل لغات و توصیفات

تاریخ خبر:
1400/12/02 02:06
نشست ها، همایش ها، گردهمایی.. نورسافت
حجت الاسلام و المسلمین توحیدی: در حال حاضر، تعداد مداخل لغوی استخراج شده از کتب حدود یک میلیون و دویست هزار عدد می باشد؛ که ذیل حدود صد و پنجاه هزار مدخل نماینده ارائه داده ایم.

نشست علمی «قاموس هوشمند نور؛ ساماندهی نوین مداخل لغات و توصیفات و ایجاد شبکه واژگانی زبان عربی»، روز چهارشنبه 12 آبان 1400 در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی، به صورت حضوری و هم زمان به صورت مجازی، برگزار گردید.

در این جلسه، کارشناسان پایگاه، جناب حجت الاسلام والمسلمین آقای مسیح توحیدی، مدیر پژوهشکده متن کاوی نصوص دینی مرکز و آقای دکتر حبیب سریانی، کارشناس حوزه متن کاوی، ادبیات و لغت مرکز نور، ضمن معرفی پایگاه، توضیحاتی در خصوص امکانات و فعالیت های صورت گرفته در این وبگاه ارائه نمودند و در ادامه، ناقدان مدعو، آقایان دکتر علی زاهدپور، پژوهشگر و مترجم زبان عربی و دکتر محمد ملکی، عضو هیئت علمی دانشگاه ادیان و مذاهب، به نقد و بررسی پایگاه و توضیحات کارشناسان پرداختند.

ابتدای جلسه آقای دکتر سریانی کارشناس گروه ادبیات و متن کاوی مرکز تحقیقات کامپیوتری علوم اسلامی، کلیاتی راجع به پایگاه قاموس بیان نمودند. ایشان پایگاه قاموس را اولین پایگاه عمومی و رسمی در زمینه لغت و فرهنگنامه های لغت عربی بر شمرده و خبر از شروع آزمایشی این پایگاه دادند. در ادامه ایشان گفتند: آنچه امروز در پایگاه قاموس به چشم می خورد، آغاز یک حرکت تحولی در حوزه لغت عربی است بنابراین وجود خطا و اشکال در برخی جست وجوها امری طبیعی بوده و ان شاءالله با گام های بعدی تکمیل خواهد شد.

ایشان افزودند: جهت استخراج ماشینی مداخل و توصیفات، ابتدا کتاب هایی در دستور کار قرار گرفت که نظم و انسجام بیشتری داشتند. در مراحل بعدی سائر کتب لغوی به این مجموعه افزوده خواهد شد. این کارشناس در وجه نام گزاری پایگاه قاموس گفتند: «قاموس» لفظی مشترک در زبان فارسی و عربی است و نسبت به واژه نامه و لغتنامه از عمق بیشتری برخوردار است، بنابراین نام این پایگاه «قاموس» گزارده شد. کلمه «قاموس» از ریشه «قَمس» گرفته شده؛ به معنای غوص و غور در لغت. ایشان در ادامه، با اشاره به تجمیع لغتنامه ها و تسهیل دسترسی به آن ها در پایگاه قاموس، خاطر نشان کردند ما در مرکز نور، این اهداف بلندمدت را داریم که در بحث لغت نامه فقط به تجمیع بعضی از لغت نامه های عربی و آسان سازی دسترسی به آن ها اکتفا نکنیم؛ بلکه به این سوی برویم که با استفاده از فرآیندهای هوشمندسازی، بتوانیم تولید محتوا هم داشته باشیم؛ یعنی بگوییم با توجه به این کلمه و این معانی و این استعمالات و شواهد، این معنا رتبه یک را دارد و آن معنا، رتبه دو دارد. این توصیفات را می شود استنتاج و استنباط کرد و خود ما در این زمینه تلاش کنیم که مثل خیلی از لغت نامه های امروزی مثل المعجم الوسیط که مثلاً توسط هشت نفر از اُدبای مصری تهیه شد یا مثل المنجد فی اللغة العربیة المعاصرة که توسط اُدبای لبنانی تهیه شده، ما هم در مرکز به این سمت برویم که یک لغت نامه مستقل داشته باشیم.

فقط نکته حایز اهمیت این است که چون فعلاً فاز یک کار بود، سعی کردیم کتاب هایی را بیاوریم که استخراج و ساماندهی اطلاعات آنها راحت تر هست.

در انتها ذکر این نکته را نیز لازم دانستند که در تولید قاموس نور به مخاطرات لغتنامه های عربی نیز توجه شد. به عنوان نمونه علیرغم توجه برخی لغتنامه ها نظیر صحاح به حفظ زبان قرآن برخی دیگر از لغتنامه ها نظیر المنجد به دنبال اسلام زدایی از واژگان عربی هستند مثلا المنجد راجع به واژه مسیح یا صلیب توضیحات مفصلی می دهد اما به واژه محمد که می رسد به توضیح کوتاهی بسنده می کند. همچنین المنجد ثلاثی مزید را ذیل ثلاثی مجرد ذکر نموده است که این هم ملاک علمی ندارد. همه این موارد، در تولید پایگاه قاموس مورد نظر بوده است.

تکیه بر شاهد مثال های قرآنی از دیگر امتیازات پایگاه محسوب می شود. ایشان در انتها گفتند: در نشست آتی راجع به جنبه هوشمندی پایگاه بحث می کنیم.

در ادامه حجت الاسلام و المسلمین توحیدی گفتند: بحث امروز راجع به استخراج، تجمیع و هماهنگ سازی اطلاعات لغوی است. با توجه به محدودیت مداخل، ما حلقه ارتباط میان متون و مداخل را فراهم کردیم که مربوط به بخش هوشمندی پایگاه می شود. در صورتی که در پایگاه جامع الاحادیث و یا نورلایب کاربر درخواست توصیف معنایی بدهد با اتصال به پایگاه قاموس پاسخ مناسب را دریافت خواهد کرد. در پایگاه قاموس از کتاب هایی استفاده شده که به لحاظ ساختاری از اتقان کافی برخوردارند و می توان به کمک ماشین مداخلشان را استخراج نمود.

ایشان در ادامه افزودند: بعد از آن که مداخل و توصیفات را از کتاب های مختلف استخراج می کنیم، با این مطلب مواجه می شویم که مدخلی مانند «کَتَبَ النَّاقَة» در کتاب های لسان اللسان، تاج العروس و اقرب الموارد، آمده و هرچند یک مدخل هست، ولی از نظر اعراب گذاری به سه گونه ارائه شده است. یکی از کارهایی که ما در ایجاد انسجام باید انجام می دادیم، هماهنگ سازی این ها بود که اگر این کار صورت نمی گرفت، باید این سه مدخل به صورت سه پاسخ به کاربر ارائه می شد. اگر شما در پایگاه ملاحظه کنید، می بینید موارد «کَتَبَ النَّاقَة» تجمیع شده و سه توصیف ذکر شده در سه کتاب، ذیل یک مدخل آمده است. پس، این یکی از اقدامات ما بود که بتوانیم اطلاعات اولیّه استخراج شده را هماهنگ کنیم.

از زاویه دیگر، مشاهده می کنیم که در کتب مختلف برای ارائه یک مدخل و توضیح آن از تعابیر متنوعی استفاده می شود. به عنوان نمونه برای فعل ماضی «کَتَبَ» و توصیف مفهوم و معنای آن گاهی آمده است: «کَتَبَ سِقَا.» گاهی نیز می گویند: «کَتَبَ اِربَع»؛ ولی در تمام موارد به دنبال بیان معنا و مفهوم «کَتَبَ» هستند. ما برای این که این تشتت و تعدد را ساماندهی کنیم، به اصطلاحِ «مدخل نماینده» رسیدیم؛ یعنی متوجه شدیم تمامی این مداخل، از یک مدخل نماینده ای برخوردار هستند که می توانیم همه این ها را با وجود تنوع و تعددی که در متن مدخل آنها و هم توصیفات خود دارند، ذیل آن مدخل نماینده قرار بدهیم.

در حال حاضر، تعداد مداخل لغوی استخراج شده از کتب حدود یک میلیون و دویست هزار عدد می باشد؛ که ذیل حدود صد و پنجاه هزار مدخل نماینده ارائه داده ایم.

با شکل گیری «مدخل نماینده» و اتصال آن با مداخل لغوی، دریچه ای باز شد تا بتوانیم از اطلاعات دیگری که در منابع لغوی و یا حتی غیر لغوی وجود دارد و می تواند مرتبط با مدخل نماینده بشوند نیز استفاده کنیم.

به عنوان نمونه در منابع لغوی در خلال توصیف مداخل، بعضا از آیات قرآن به عنوان شاهد بهره می گیرند و معانی خاص آن کلمه را در قرآن هم ذکر می نمایند. در این موارد ما آیه قرآن را به عنوان یک مدخل در نظر می گیریم و به همراه توصیف ارائه شده در کتاب نسبت به واژه موجود در آیه، اقدام به قرار دادن این مدخل قرآنی ذیل مدخل نماینده می کنیم.

به طور مثال، آیه «فَاَرسَلنَا علیهم الطوفان و الجَرَاد و القُمَّل و الضَفَادِعَ و الدَّمَ» ذیل مدخل «الدَّم» آمده است؛ چرا؟ به جهت کلمه «الدم» که در آیه قرآن به کار رفته و مجمع البحرین نیز به آن پرداخته است. این مساله، باعث شده که بتوانیم این مدخل قرآنی را به عنوان شاهد در کنار توصیف معنایی ارائه کنیم.

همچنین، توانستیم از شواهد متنی که در اصطلاح از آن ها به «غریب الحدیث» یاد می شود و در کتاب هایی مثل الفائق زمخشری و نهایه ابن اثیر یا در خلال منابع لغوی مثل لسان العرب یا کتاب های دیگر وجود دارند، به عنوان مدخل و ذیل مداخل نماینده و در دسته بندی جداگانه استفاده کنیم که آمار آن ها تاکنون، صد و چهل و یک هزار شاهد است.

بر همین اساس توانستیم به تدریج ارتباط بین مداخل نماینده را نیز برقرار کنیم. با استفاده از منابعی که به رابطه ترادف و یا تضاد بین مداخل پرداخته بودند توانستیم شبکه ارتباطی بین مداخل نماینده را بر محور ترادف یا تضاد در اختیار کاربران قرار دهیم. همچنین ارتباط موضوعی بین مداخل نماینده که در منابعی همچون «فقه اللغه ثعالبی» به آن پرداخته است را در این پایگاه به نمایش گذاشتیم.

آنچه تا اینجا به عرض رسید در خصوص محتوای ساختارمند پایگاه قاموس بود اما در خصوص هوشمندی این پایگاه و امکان ارائه بهترین پاسخ به درخواست کاربر که موضوع نشست بعدی خواهد بود به طور اجمال و در قالب مثال به استحضار می رسانم:

فرض کنید کسی معنای واژه «لُمتُنَنِی» را که در قرآن آمده (فَذلِکُنَّ الذِی لُمتُنَّنِی فِیهِ)، می خواهد بفهمد؛ به طور معمول نخست باید اطلاعات صرفی داشته باشد و بداند حرف «نون» در واژه «لُمتُنَّنِی»، وقایه است و حرف «یاء»، یای متکلم است و «لمتنّ»، صیغه دوازدهم است و ریشه آن، «لام واو میم» است تا بعد از این تحلیل ذهنی بتواند با مراجعه به کتاب لغت ذیل ریشه شناسایی شده به مطلوبش برسد. قاموس نور این امکان را به شما می دهد که همان «لُمتُنَّنی» را کاوش کنید و مبتنی بر پردازش های هوشمند نزدیک ترین پاسخ را دریافت کنید.

در ادامه آقای دکتر زاهدپور محقق و مترجم در حوزه زبان عربی با اشاره به فعالیت های چشم گیر مرکز در حوزه دیجیتالی نمودن علوم اسلامی، پایگاه قاموس را پایگاهی راهگشا برای مبتدیان و محققان دانستند. ایشان با ذکر یک مثال گفتند محقق در پایگاه قاموس با دو یا سه مرحله می تواند به حروف اصلی کلمه «لُمتُنَّنی» برسد.

یکی از نکات ایشان به منظور تکمیل شدن پایگاه، وجود ابهام در فایل توضیحات پایگاه قاموس بود. ایشان در این باره گفتند: اصطلاح «برچسبگزاری» برای عموم کاربران مبهم و نامفهوم است بهتر است به جای آن از ویژگی های صرفی یا لغوی استفاده شود. همچنین استفاده از واژه توصیف، در این جا برای مداخل چندان مطلوب به نظر نمی رسد و بهتر است واژه توضیح به کاربرده شود. «مداخل نماینده» نیز اصطلاحی رایج نیست و توضیح آن نیز کامل و روشن نیست. نمونه دیگر در عبارت «بازبینی اطلاعات استخراج شده توسط محققین به منظور تکمیل یا اصلاح موارد»، منظور از «موارد» چیست؟

ایشان در ادامه افزودند: متن مقاله آقای سریانی نیز دارای ابهامات و اصطلاحات نامفهوم بود. اصطلاح «مدخل النائب» اصلا برای یک عرب زبان مفهوم نیست، همچنین «الاستخراج العالی». راجع به «مشتق اصطلاحی ثلاثی مجرد» توضیحی داده نشده است.

یکی دیگر از نقص های پایگاه، هایلایت نکردن متن مورد نظر در منبع لغوی است که باعث سردرگمی مراجع می گردد. همچنین توصیفاتی که کتب لغوی همانند یکدیگر بیان نمودند، یکی نشده است تا کار محقق آسان شود.

در ادامه جلسه، آقای دکتر ملکی نهاوندی گفتند: کاری که انجام شده، واقعا خدمت عظیمی است و یک دانش جدید است و در حوزه علمیه به این شکل کار نشده است. بنده مطالبی را که به نرم افزار و پایگاه مربوط می شود، به صورت مکتوب می نویسم و در فرصت مناسب ارائه می کنم؛ اما اجازه می خواهم در این فرصت، مطلب دیگری را مطرح نمایم.

اگر عربی را دو قسمت کنیم، یک قسمت آن، عربی معاصر است و یکی هم عربی اصیل. عربی ای که پایه و اساس قرآن کریم و روایات است، عربی اصیل است و طلاب هم با آن سروکار دارند. پس، باید مقدمات این دو دسته را هم بیاوریم؛ یعنی مخاطب بداند که مبنای تان در مصادر و منابعی که آوردید، چیست؟ آیا این نرم افزار، همه منابع لغوی را قبول دارد؟ یعنی آیا مصادر لغوی که برای لغت نوشته شده اند، مبنای کار شما بوده است؟ یا کتاب های غریب القرآن و غریب الحدیث و مفردات، یا اشعار عرب و نصوص عرب هم مبنا بوده است؟ آیا همه این ها در همه اعصار تاریخ، مبنای شما بوده اند؟

از جمله درخواست هایی که ایشان مطرح نمودند این بود که سایت را از نیاز به لاگین شدن خارج کنید و امکان کامنت گزاری را برای مراجعین فراهم کنید تا در صورت مواجهه با اشکال آن را بیان کنند. معرفی این پایگاه در محافل حوزوی و دانشگاهی و ذکر کردن تمامی منابع لغوی نیز از دیگر نکات مطرح شده بود. ایشان در این باره افزودند: هیچ منبعی را از قلم نیندازید حتی منابع دست چندم نیز گاهی برخی ویژگیهایی دارند که برای محققان مطلوب است. به عنوان نمونه التحقیق آقای مصطفوی نیز ذکر گردد.

در انتها ایشان گفتند: نواقص و اشکالاتی که در جست و جوها پیدا نمودم به صورت مکتوب خدمت دوستان ارائه میکنم.

در بخش جمع بندی حجت الاسلام و المسلمین توحیدی گفتند: پایگاه نیازی به لاگین شدن ندارد مگر در مواردی که شخص می خواهد متن لغتنامه را ملاحظه کند که در این صورت به طور خودکار وارد پایگاه نورلایب می شود. موارد مبهمی که آقای دکتر زاهدپور فرمودند انشالله به زودی اصلاح می گردد.

ایشان راجع به استخراج مداخل لسان العرب گفتند این کار توسط ماشین و با تاخیر صورت گرفت. چرا که این کتاب فاقد ساختار منظم بود بنابراین با استخراج مداخل از کتب دیگر کار برای شناسایی مداخل لسان العرب توسط ماشین دقیقتر شد. ایشان در ادامه بخش اعلام اماکن در پایگاه را ارائه نمودند.

ایشان اصطلاح برچسب گزاری را ترجمه واژه تگ در انگلیسی خواندند. همچنین استفاده از 7 فرهنگ لغت فارسی به ویژه دهخدا و فرهنگ نفیسی را در پایگاه قاموس متذکر شدند.

ایشان فعالیت های آتی مرکز در حوزه لغت را در سه بخش خلاصه نمودند:

• ساماندهی و دسته بندی توصیفات ذیل مداخل نماینده

• ارتباط دهی معنایی بین مداخل با بهره گیری از تحلیل ماشینی

• ارتقای سطح هوشمندی جست و جو گر قاموس

آقای دکتر سریانی نیز در این بخش، گفتند: یکی از این چالش ها، در مورد شیوه ای است که کتاب المنجد دارد و سعی کرده است به سبک بازگرداندن کلمات به معنای اصلی که ابن فارس در معجم مقاییس اللغه دارد عمل کند؛ اما این شیوه، در خیلی جاها نقض دارد؛ یعنی یک ثلاثی مزید را ذیل یک ثلاثی مجرد آورده و ذیل ثلاثی مجرد دیگر، این کار را نکرده است.

آیا مثلاً بگوییم این ثلاثی مزید، عیناً مرتبط معنایی با این ثلاثی مجرد است و یا این صفت مشبهه، مربوط به این ثلاثی مجرد است؟ تردید داریم که آیا می توانیم قطعاً مثل المنجد عمل کنیم یا این که خیر؛ باید دست خودمان را مثل معجم نویس های دیگر همچون المعجم الوسیط باز بگذاریم و خود کاربر تشخیص بدهد آیا این مدخل با مداخل دیگر مرتبط هست یا نه.

چالش دوم، در مورد تجمیع مداخل است. آیا مداخل را تا جایی که امکان دارد، به هم متصل کنیم مثل المنجد، یا اینکه به دلیل نقض های بسیاری که در عمل وجود دارد، این کار را انجام ندهیم.

چالش دیگر، در مورد تجمیع توصیفات هست. در فاز بعدی، می خواهیم سراغ تجمیع توصیفات برویم که آقای دکتر زاهدی فرمودند. این که واقعاً تا چه حد توصیفات را تجمیع کنیم. آنجایی که عین هم هستند یا آنجایی که این طور نیستند، مثلاً ممکن هست یک اختلاف در «با» و «فی» داشته باشند، آیا اینجا می توانیم تسامح قائل بشویم و بگوییم: این دو چیز، یک چیز هستند؟ یا اینکه ظرافت های لغوی را حفظ کنیم. مسئله تجمیع توصیفات هم یک مشکل است.

این مطلبی که ذکر شد، بیانگر آن است که سختی کار ما در مسیر هوشندسازی و شناسایی ماشینی کلمات، فوق العاده زیاد است. همه این ها از مواردی است که نیاز دارد بدانیم چه قدر باید پیش برویم و تا چه اندازه در توصیف مداخل و اجتهاد کردن دستمان باز است. آیا فقط در مرحله تجمیع باقی بمانیم یا این که مرکز نور، مستقلاً به سوی ایجاد توصیفات جدید و تولید لغت نامه جدید گام بردارد. این مباحث باید شفاف سازی شود.

در ادامه جلسه دکتر زاهدپور در تبیین ضرورت توسعه حداکثری منابع لغوی در پایگاه قاموس نور گفتند: در تایپ عربی، حرف «وَ» به کلمه بعد می چسبد و در اینجا ما این «و» را جدا می بینیم؛ چرا؟ آیا عمدی بوده است؟

مسئله دیگر این که در لغت، کار اجتهادی نکنید. ما عرب زبان نیستیم و بدون مراجعه به لغت، نمی توانیم واژگان کتاب های لغت را معنا کنیم؛ مثلاً تصحیح امالی سید مرتضی، کار یک عرب زبان ادیب است. یک فارسی زبان، خیلی باید ادیب باشد تا بتواند امالی را تصحیح کند. بنده می گویم همین منابعی که هست را بگذارید باشد. کار اجتهادی روی آن ها نکنید. اصلاً از نظر روش شناسی هم اشتباه است. ما نمی توانیم این کار را انجام بدهیم؛ چون مترجم باید زبان مقصد، زبان مادری او باشد.

ایشان در ادامه گفتند: چه طور شد این همه کتاب لغت را آوردید؟ آیا همه کتاب های لغت مورد تأیید هست؟ من عرض می کنم اصلاً عرب ها روی زبان خودشان کار نکردند؛ یعنی همین لسان العرب را اگر ابن منظور ننوشته بود، الآن لغت نامه ای به این گستردگی نداشتیم. خود عرب ها در زمینه آموزش مکالمه و لغت، کار درست و حسابی نکرده اند. در آموزش انگلیسی، هر سال کتاب عوض می شود؛ اما در عربی، چنین چیزی نداریم. بنابراین، مغتنم هست که هرچه کتاب در زمینه لغت عرب باشد، حتی منجد الطلاب، آن هم در برنامه وجود داشته باشد. چون بنده با کار ترجمه سروکار دارم، این نکته را عرض می کنم که همان کتاب هایی که به نظر ما قابل استفاده نیست، ممکن هست یک معادل برای یک لغت آورده باشد که خیلی راهگشا باشد؛ مثلاً در بین فرهنگ های قدیمی عربی ـ فارسی، فرهنگ اصطلاحات معاصر آقای سید مصطفی طباطبایی، در زمینه معادل یابی بسیار عالی است. پس، بنده موافق هستم هرچه کتاب لغت در دست شما هست، بیاورید.

این که گفتم روی زبان عربی از این نظر کار نشده، در قیاس با زبان انگلیسی است و عربی، بسیار عقب است. ثانیاً نمی گویم اصلاً کار نشده است؛ ولی وقتی بیست و دو کشور به زبان عربی حرف می زنند و تعداد فراوانی دانشگاه عربی داریم، از اینها انتظار می رود که کارهای خیلی حسابی و مفصلی در حوزه زبان عربی و واژه شناسی داشته باشند. ما در عربی، چیزی مثل وب سرویس دیکشنری نداریم که هر سال ویرایش بشود. کدام فرهنگ لغت عربی معاصر را می توانیم با خیال راحت به آن استناد کنیم. من الآن یک مترجم رسمی هستم؛ گاهی سندهایی در خصوص احکام دادگاه تجدید نظر کویت برای من می آید و اصطلاحاتی در آن هست که هیچ فرهنگ عربی آن را ندارد. بنابراین، مجبورم به سایت دادگستری کویت مراجعه کنم و حکم های دیگری را که مشابه باشد، پیدا می کنم و ترجمه نمایم.

سایت المعانی که دوستان فرمودند گل سرسبد کارهای عرب زبانان است، خیلی نقص دارد. ما الآن سیستم آموزش زبان عربی نداریم و انتظار داریم خود جهان عرب بیاید یک کتاب ارائه بدهد که سیستم آموزش امروزی داشته باشد.

مسئله دیگر که بسیار مهم است، مخاطب محور بودن هست که شما بیان فرمودید. من واقعاً دست مریزاد می گویم به شما که کاربر با درج یک کلمه در خط جست وجوی سایت، حالت های دیگر آن کلمه نیز پیشنهاد داده می شود و او را به مقصود می رساند. این، کار خوبی است و باید در توضیحات خود، آن را برجسته کنید؛ البته نواقصی دارد؛ مثل اینکه وقتی واژه «شقی» را کاوش می کنم، علاوه بر پاسخ های مرتبط، کلمه ای مثل «مَشَقَ» هم می آید که ارتباطی به دیگر پاسخ ها ندارد. در مجموع، این که برنامه شما مخاطب محور است، بسیار ارزشمند است و بر حُسن کار شما می افزاید.

مسئله دیگر، درباره المنجد است که در این باره صحبت جدی دارم. مبنا در زمینه عربی، تا آنجا که می دانم، دو کتاب لغت بوده است که در توضیح یا توصیف مدخل ها، به معنای اصلی اشاره کرده اند. یکی، معجم مقاییس اللغه است که معانی متباین یک واژه را بیان می کند و مثلاً می گوید فلان کلمه، دارای سه معنای متباین است و در حقیقت، استعمال های مختلف را بیان می کند. دوم، کتاب المنجد است. شما اگر المنجد را ببینید، ذیل مادّه «ضربَ»، تا هشت معنا را شماره گذاری کرده است؛ یعنی همان ابتدا می گوید این «ض ر ب»، هشت معنای متباین دارد و بعد گفته خوب ببینید «ضَرَبَ» ای که به معنای حرکت است، باب افعال است؛ یعنی «إضرب». این ویژگی المنجد، برای آموزش صرف و نحو و نیز ترجمه، بسیار عالی است.

پیشنهاد دیگر این که اگر متن طبری را که ترجمه شده، در کارتان در نظر بگیرید یا محصول جداگانه ای تولید نمایید، خیلی مفید است. مجموعه نور، با توجه به توانمندی هایی که دارد، می تواند این کار را انجام بدهد.

در انتهای جلسه دکتر سریانی راجع به استفاده از هوش مصنوعی در پایگاه قاموس نور گفتند: یک مطلب عرض می کنم که پیش زمینه ای باشد برای نشست بعدی که ان شاءالله از حضور شما ناقدان محترم استفاده کنیم و آن، بحث هوشمندسازی فضای پایگاه است. وقتی کاربر کلمه ای را جست وجو می کند، اگر عین همان کلمه را داشته باشیم، همان را در اختیارش می گذاریم؛ یعنی سامانه به طور هوشمند به آن کلمه، یک الف و لام اضافه می کند و به شکل مدخل نماینده آن را بازیابی می نماید؛ مثل این که مثلاً کاربر در خط جست وجو واژه «ضَرَبتُ» را می نویسد و سیستم «ضرب» را در مداخل خودش دارد. هوش مصنوعی، کارش در اینجا این است که حرف «تِ» را از آن کلمه برمی دارد و آن را پیراسته می کند. در مرحله بعد، به سراغ کلماتی می رود که از موتور صرف به دست می آید. پس، نرم افزارهای هوشمند علاوه بر این که آن کلمه را پیراسته می کنند، یک مرحله جلوتر می روند و آن را واکاوی صرفی می کنند؛ مثلاً می گویند این کلمه، صیغه دوازده است و یا این کلمه، صیغه ششم است و یا این کلمه، صفت مشبهه است و بعد آن را به نزدیک ترین کلمه ای که در مداخل دارد، متصل می کند. این سه فرایندی است که در فاز هوشمندسازی سیستم در حال شکل گرفتن و تکمیل است و ان شاءالله بتوانیم در فازهای بعدی، عیناً کلمه را مشخص کنیم.