• יו"ר: פרופ' יוחאי אדיר
  • מזכיר ונציג ישראל ב-ERS: ד"ר אמיר בר שי
  • גזברית: ד"ר דניאל בן דיין
  • חברת ועד, עורכת האתר: ד"ר מיכל שטיינברג
  • חבר ועד: ד"ר דרור רוזנגרטן
קורונה עולמי

תחזית: עד סוף השנה יהיו יותר ממיליון מאמרים מדעיים על נגיף הקורונה

Covid-19 Search, מנוע חיפוש חדש, משוכלל ומהיר של ענקית הטכנולוגיה סיילספורס, יאפשר לחוקרים, לקובעי מדיניות ולעוסקים בפיתוח תרופות וחיסונים לנגיף גישה מהירה למידע המחקרי העדכני ביותר

מנוע החיפוש COVID-19 SEARCH

מאז פברואר ועד מאי 2020, מספר המאמרים המדעיים שפורסמו בעיתונות הרפואית על נגיף הקורונה (COVID-19) והמגיפה העולמית המתמשכת שחולל זינק מ-29 אלף ליותר מ-138 אלף ועל פי התחזיות  עד סוף 2020 יגיע מספרם ליותר ממיליון. רבים מהם עשירים בנתונים מספריים, גרפים וסטטיסטיקה, ומשתרעים על מאות עמודים כל אחד.

עקב כך נוצר צורך מיידי לפתח בדחיפות מנוע חיפוש משוכלל ומהיר מאלה הקיימים, המבוסס על עקרונות בינה מלאכותית AI כדי לאפשר לחוקרים העוסקים בתחום חם זה, לקובעי מדיניות ולמעשה לכל מי שעוסק בפיתוח חיסונים וטיפולים גישה מהירה לכל פרטי המידע המחקרי העדכניים ביותר, בהתאם לנוסח השאלה שיוצג למנוע החיפוש.

ענקית הטכנולוגיה "סיילספורס" העוסקת בפיתוח מנוע החיפוש החדיש Covid-19 Search מתכוונת להנגישו ולאפשר זמינות מלאה לשימוש בו לציבור הרחב וללא עלות.

החברה איגדה למשימת פיתוח מנוע החיפוש צוות מומחי תוכנה עם ניסיון ספציפי בעיבוד שפה טבעית NLP. הפרויקט המאתגר זכה לחסות הבית הלבן. הוא נועד לזרז פיתוח אלגוריתמים ומנועי חיפוש שמטרתם לאפשר לחוקרים להבין טוב יותר את טבעו והתנהגותו של הנגיף החדש כדי להילחם בו במיוחד בתנאי הלחץ של המגיפה.

במנוע החיפוש החדיש שולבו עקרונות אחזור טקסט ו-NLP - כולל חיפוש סמנטי, QA עדכני ביותר ו-Abstractive Summarization כדי להבין טוב יותר את השאלה ולהביא את התוצאות המדעיות הרלוונטיות ביותר.

כשמדובר בחיפוש סמנטי, סדר המילים בחיפוש מדעי יחיד הוא ספציפי מאוד. לכל שינוי קל בסדר זה יכולה להיות משמעות שונה באופן דרסטי. לכן, שולב חיפוש אחזור מידע (IR) עם החוזקות  שב-NLP כדי להדגיש את המשמעות שמאחורי כל שאילתה.

כשמדובר במערכת QA, חיפוש סמנטי יכול להוביל לקבוצת מסמכים אדירה במימדיה ולצמצם אותה לקבוצה המכילה 100 או 1,000 מסמכים. מנוע החיפוש מריץ מסמכים אלה דרך מערכת ה-QA המבוססת AI המתייחסת לשאילתה של המשתמש כאל כל שאלה ועושה כמיטב יכולתה כדי ליצור תשובה מהמידע העשיר שנלקח מתוך המסמכים שאוחזרו. אם התשובה כלולה במסמך בודד, ניתן דירוג מחדש של רשימת המסמכים שבהם נכללה ומסמך ספציפי לעניין זה יופיע בו ראשון. על ידי חיפוש במסמכים שונים, המנוע עוזר למשתמשים למצוא תוצאות מדויקות יותר.

מערכת Abstractive Summarization ששולבה במנוע החיפוש "קוראת" מסמך בודד או קבוצת מסמכים ומייצרת סיכום שלהם. התקדמות האחרונה בתחום הזה היא מינוף מודלים של שפות שונות כדי ליצור סיכום קצר ולאחר מכן לדרג מחדש את התוצאות על סמך המסמכים התואמים ביותר את השאילתה.

כאשר הוחלט להיכנס לפרויקט המאתגר התקיימה ועידת מומחים במדעי המחשב, TREC, שהקימה את מה שזכה לשם אתגר הTREC-COVID Information Retrieval. זוהי למעשה תחרות שנוצרה כדי להעריך באופן אובייקטיבי את מנועי החיפוש השונים הנדרשים לנושא ה-Covid-19. התחרות גרמה להאצת שיתופי הפעולה בין קהילת חוקרי NLP ו-IR, ומאפשרת להם לפתח טכניקות תכנות הרבה יותר מהירות, מתוך תקווה שהן יתרחבו עוד יותר.

נושאים קשורים:  מגיפת הקורונה,  מחקרים,  חדשות,  נגיף הקורונה,  מנוע חיפוש,  Covid-19 Search,  מאמרים מדעיים
תגובות
 
אנונימי/ת
04.07.2020, 12:19

ובית המשפט הישראלי ישאל את הרופא הנתבע ברשלנות : איך זה שאדוני לא היה מעודכן בספרות המקצועית?

21.07.2020, 15:50

יופי יהיה מה לקרא בבידוד .