30-04-2020، 19:26
يک کاربر براي توليد اطلاعات آنلاين نيازمند سيستمهاي اتوماتيک شده و جواب دادن به سوالات زيادي است. بنابراين به سيستمهايي که کاربر اجازه پرسيدن سوال به هر زباني و دريافت جواب آن با سرعت و بهطور مختصر را دارد، مورد نياز است.
ماشينهاي جستوجو در حال حاضر توانايي رتبهبندي ليستي از مستندات مربوطه را دارند، اما آنها توانايي برگرداندن جواب کامل يا مختصر به کاربرها را ندارند.
سيستمهاي پاسخگويي به سوال اين مشکل را مورد توجه قرار ميدهد.
در آخرين موفقيتها در سلسله تحولات پاسخگويي به سوالات که در سال 1999 شروع شد و بهعنوان بخشي از کنفرانس بازيابي نوشته نام گرفت، گزارش شده است که بهترين سيستمها در حال حاضر توانايي جواب دادن به بيش از دو سوم سوالات واقعي را در اين تحول دارند.
ابعاد مساله
اصولا براي پاسخ به يک پرسش، سيستم بايد سوال را تحليل و بررسي کند، همچنين بايد يکي يا تعداد بيشتري از جوابها را با نتيجهگيري از منابع بيابد و پاسخ به بعضي از فرمهاي مناسب را به کاربر نمايش دهد.
ارزيابي از تستهاي درک مطلب استفاده شده راه متفاوت نزديک شدن به جواب سوالات را فراهم ميکند. همچنين تستهايي وجود دارد که براي ارزيابي درک دانشآموزان استفاده ميشود و براساس نتايج آنها، اساس و بنياني را براي مقايسه کارآيي سيستمها به منظور رسيدن به کارآيي بيشتر فراهم ميکنند.
اين مساله عنوان يک کنفرانس بود که در سال 2000 توسط جان هاپکينز در تابستان آن سال برگزار شد که ما خلاصهاي از اين کنفرانس را توضيح ميدهيم.
الف- کاربردها: جواب دادن سوالها کاربردهاي بسياري دارد. ما ميتوانيم اين کاربردها را به زيربخشهايي تقسيم کنيم که اساس آن براساس منابع اين سوالهاست:
پايگاهها داده، دادههايي نيمه ساختار يافته يا نوشتههاي آزاد است که ما ميتوانيم در ميان تحقيقات حول مجموعه جمعآوري شده مشخص، بيشتر تمايز قايل شويم. به عنوان مثال: جستوجو در وب، جستوجو در يک مجموعه يا کتاب يا جستوجو روي يک متن ساده بهعنوان ارزيابي براي درک مطلب.
ب- کاربرها: کاربرها ميتوانند مبتدي باشند يا کاربرهاي اتفاقي براي تکرار کردن يا کاربرهاي حرفهاي کساني که ممکن است از اين چنين سيستمهايي در جريان کارهايشان استفاده کنند. بهوضوح اين کلاسهاي متفاوت از کاربرها به واسطههاي متفاوتي نياز دارند که سوالهاي متفاوتي دارند و انواع جوابهاي متفاوتي را با توجه به نياز خود ميطلبند.
ج- سوالات: ما هنوز متوجه نشديم که چگونه ميتوان پيشبيني کرد چه سوالهايي سختتر از سوالهاي ديگري هستند، حول جامعه تحصيلي تست شده. اين موضوع يک موضوع با اهميت است.
ما ميتوانيم سوالها را با نوع جوابها تشخيص دهيم، ما در اينجا تمرکز خود را روي جوابهاي واقعي ميگذاريم، مانند تستهاي درک مطلب هرچند انواع ديگري از سوالها را اغلب شامل ميشوند.
بعد از آن ميتوانيم بين انواع سوالها تمايز قايل شويم؛ سوالات آري / خير، درخواستهاي غير مستقيم، تقاضاها.
با تمامي اينها بايد بهعنوان يک سوال برخورد شود. ما اطمينان داريم که بعضي از انواع سوالها از بقيه سختتر هستند.
براي مثال (چرا / چگونه) منجر به جواب سختتري ميشوند، بهخاطر اينکه آنها نيازمند فهميدن ارتباط سودمند يا علت بهوجود آمدن اين ارتباط هستند و اينها در واقع نوعا بهعنوان يک علت يا حس متفاوت بيان ميشوند.
د- جوابها: جوابها ممکن است طولاني يا کوتاه باشند آنها ممکن است فهرستبندي شده يا مفصل و توضيح داده شده باشند.
آنها ممکن است به مقتضاي کاربرد يا مقصود کاربر متفاوت باشند براي مثال اگر کاربر بخواهد و قصد توجيه داشته باشد اين مساله منجر به جواب طولانيتري خواهد شد اما جوابهاي کوتاه، تستهاي درک مطلب طبعا نياز به جوابهاي کوتاهتري دارد.
ه- ارزيابي: چه چيزي منجر به يک جواب خوب ميشود؟ آيا يک جواب طولاني، شامل محتواي کافي براي توجيه کردن اندوختههاي سوال، بهعنوان يک جواب خوب ميتواند در نظر گرفته شود؟
محتوا مفيد خواهد بود اگر سيستم چندين جواب داوطلبانه را نمايش دهد، چون اين به کاربر اجازه ميدهد که جواب درست را بيابد، حتي اگر آن جواب جزو بهترين جوابها قرار نگيرد اگرچه به بيان ديگر و از طرفي جوابهاي کوتاه ميتوانند بهتر باشند و بيشتر مورد استفاده قرار گيرند.
و- نمايش: در جستوجوي اطلاعات واقعي، کاربري وجود دارد که با سيستم در زبان بلادرنگ ارتباط دارد. کاربر اغلب با سوالهاي عمومي شروع ميکند و سيستم مستقيما يا با برگرداندن مستندات به صورت غيرمستقيم بازخوردي فراهم ميکند.
کاربر سپس جستوجو را محدودتر ميکند بنابراين انواع مختلفي از محاوره را با سيستم به کار ميگيرد، آسان کردن اين فعل و انفعال محاورهاي بهطور خوشايندي هم آساني استفاده و هم خشنودي کاربر را افزايش ميدهد. علاوه بر اين اگر واسط بتواند ورودي مکالمه و گفتوگو را کنترل کند اين سيستم قابليت استفاده به منظور دسترسي محاورهاي به اطلاعاتي اساسي وب را فراهم ميکند.
معماري کلي
الف- تحليل سوال: ورودي سيستم لازم است توسط کاربر به اينکه چگونه فرم يا فرمهايي نياز هستند، تحليل و بررسي شود. با زيربخشهايي از سيستم در محتواي گفتوگوي جاري يک سوال ممکن است بهوجود آيد و براي روشن کردن مدلي که سيستم داراي کاربر است. کاربر ميتواند درخواست روشن شدن سوال خود را قبل از پردازش آن داشته باشد.
ب- پردازش مستندات جمعآوري شده: فرض کنيد که سيستم به يک مجموعه مستندات بزرگ بهعنوان منابع دانش براي پاسخ به سوالات دسترسي دارد. اين مجموعه ممکن است قبل از مرتب شدن نياز به پردازش داشته باشد براي تبديل آن به اين شکلي که متناسب براي پاسخ به سوالات بلادرنگ است.
ج- انتخاب مستندات کانديدا شده: زيرمجموعهاي از مستندات از کل مجموعه مستندات انتخاب شده است، به گونهاي که داشتن آن مستندات فرض شده بيشترين شباهت را به محتواي جواب سوال داشته باشد.
د- تحليل مستندات کانديدا شده: اگر مرحله پيش پردازش فقط مستندات در مستندات جمعآوري شده را تحليل کند و تحليل جزييات اضافي از کانديداهاي انتخاب شده در مراحل مقدمتر ممکن است انجام شوند.
ه- استخراج جواب: استفاده از نمايش مناسب از سوال و هر کدام از مستندات کانديدا شده، جوابهايي که از مستندات استخراج شده است را کانديدا ميکند و آنها را در جايي با احتمال دقت بالا رتبهبندي ميکند.
و- توليد پاسخ: پاسخ به کاربر برگردانده ميشود. اين پاسخ ممکن است تحت تاثير مدل کاربر و يا محتواي گفتوگو باشد، اگر نمايش داده شود.
ابعاد آينده
با وجود اينکه 40 سال از فعاليت ميگذرد، در ابتداي راه آغاز براي جستوجوي پاسخ به سوال در حوزه تحقيقات هستيم. جذابيت جدال بر سر پاسخ جواب آن را به شدت جذاب کرده است.
تحقيقات اخير در اين حوزه ابتدا روي ارزيابي پاسخ به سوال کنفرانس بازيابي متن متمرکز شده است هرچند در وسعت کمتر روي کارهاي ديگر مانند درک مطالب انجام شد. در هر صورت ارزيابي رسمي معمولا چکيدهاي از مساله واقعي است. اين ارزيابي جاري فقط گام اوليه از يک نقشه جاهطلبانه براي ارزيابي ابعاد زيادي از پاسخهاي سوال است. اين مهم است که پاسخ به سوال در دستور کار بزرگتري را يادآوري کنيم که تواناييهاي فعلي ما را براي ساختن و يا ارزيابي اين سيستمها نشان دهد.
در آخر هم بايد گفت: تکنيکهاي سنتي و غير مدرن از پردازش زبانهاي طبيعي با راههاي استخراج ساختار ذاتي در واژگان کسترش يافته آنها، ترکيب شدهاند.
در نتيجه علم محوري ميتواند براي آسان کردن تنگناي دسترسي به اطلاعات و دادههاي تکنيکهاي دستي، استفاده شود.