גוגל ענקית החיפוש
הוכתרה ב1998 כמנוע החיפוש הטוב ביותר בעולם בזכות היכולת המדהימה שהיתה למנוע
להציג תוצאות רלוונטיות על המסך במהירות הבזק. בעוד רובנו היינו צריכים לנדוד
במנועים כמו lycos ו-
altavista עד לעמוד 3 ו- 4 כדי להשיג
תוצאות רלוונטיות, ברגע שגוגל נכנסה לתמונה חיינו השתנו לעד.
יחד עם זאת
הגרסה הקיימת בלבד של גוגל מתבססת על מודל אשר מגביל את יכולת הצמיחה של המנוע
ומונע מגוגל התפתחות אמיתית. כיום לגוגל שורות של אלגוריתמים מתוחכמים, החל
מאלגוריתמים לזיהוי איכות של תוכן, אלגוריתמים המחשבים רמת אמון של אתרים ברשת,
חישובי כוח קישורים כאלו ואחרים וכלה באלגוריתמים המנתחים פעילות גולשים באתרי
אינטרנט.
ובכל זאת
חסרה למנוע הבנה מסוג אחר של המשמעויות אשר עומדות מאחורי כל מילה. למילים רבות
משמעויות שונות לחלוטין בהקשר שהן נאמרות בו. הביטוי "I love boston" יכול להתכוון לבוסטון בתור העיר בוסטון, בתור קבוצת כדורסל
או בתור להקת בוסטון. מיותר לציין שכמות הביטויים אשר להם אותו מבנה אך משמעות
שונה הוא עצום במימדים שלא ניתנים לשיעור.
זאת אומרת שעד
לנקודה זו גוגל למעשה מבינה בעיקר קשר בין ביטויים מבלי להבין במה מדובר. כאשר
נכתוב "ביל גייטס" במנוע החיפוש גוגל, ייתכן שנקבל תוצאות מאוד
רלוונטיות לביל גייטס אך עדיין רמת ההבנה של המנוע כי : ביל גייטס הוא קודם כל שם,
שקשור למיקרוסופט שקשורה לתחום התכנה וכן הלאה מוגבלת מאוד.
כלומר כיום לגוגל
יש את הקשרים הללו מכיוון שהיא מזהה אילו ביטויים נרדפים קשורים אחד לשני או מה
משותף לקבוצה של ביטויים מחופשים באותו הקשר וכו'
הרשת הסמנטית
מביאה משמעות שונה לחלוטין :
הרשת הסמנטית
באה להציע מבנה חדש לאינטרנט. מצב שבו לכל "ישות" יש הגדרה וקשרים
ל"ישויות" אחרות. ע"י יצירת רשת סמנטית מנוע החיפוש חדל להסתכל על
מילים בתור רק מילים ומסוגל להסיק את המשמעות העומדת מאחורי כל מילה, האנשים
הקשורים אליה, התחום הכללי שהיא קשורה אליו וכו'.
כמה שהרשת
הסמנטית ממשיכה לגדול ככה כמות המידע שהמנוע מבין גדלה ולמעשה כאשר נחפש משהו ברשת
הסמנטית מנוע החיפוש לא יציג לנו תוצאות מבוססות חיתוכי תוכן חכמים במיוחד אלא ממש
יבין מה הוא אותו דבר שאנחנו מחפשים, בין אם זה בנאדם, שיר מסוים, סרט וכו'.
אז מה גוגל
עושה כדי להתקדם אל עבר הרשת הסמנטית ?
בתאריך
ה-16 ליולי 2010 , גוגל הכריזה רשמית על
קנייה של metaweb, שהיא גם
הבעלים של הסטארטאפFreebase. פריבייס
הוא מאגר של יותר מ-12 מיליון ישויות סמנטיות ברשת הכוללות בין היתר אנשים, סרטים,
חדשות, מידע פיננסי ועוד. המאגר גדל בכל יום ע"י סריקות שפריבייס מריצה ברשת
על אתרים שונים ופונה אלינו הגולשים לעזור לסדר את האינטרנט ע"י הוספה של
מידע לערכים השונים.
פריבייס מדגישה
כי היא מסוגלת להבין את האינטרנט בצורה ששום אתר אחר לא יכול להבין ואכן היא
צודקת. המאגר הסמנטי צובר חכמה ומסוגל להבין רבדים רבים של קשרים בצורה הולכת
וגדלה בצורה ששום מנוע חיפוש מבוסס אלגוריתמי תוכן יוכל אי פעם להבין.
כאשר גוגל רכשה
את מאגר זה היא עושה למעשה את הצעד הראשון (הגלוי לציבור) ליצירת הרשת הסמנטית.
מכיוון שאין אפשרות לסדר את האינטרנט כולו יש אפשרות להיעזר במנועי סריקה סמנטיים
ובציבור הגולשים בכדי להשיג את המשימה.
בנוסף הטכנולוגיה שתומכת
בניתוח הנתונים של פריבייס היא עוד פיתוח של מטה ווב שנקרא
Gridworks. גוגל כבר מיהרה לשלב את
gridworks באחד מכליה, ובהדגמות מוצגת
גישה חדשה לחלוטין לחיתוך מסדי נתונים בצורה יעילה להפליא. יכולת הדיוק שניתן
להשיג עם gridworks היא מופלאה.
אין ספק ששילוב של שתי
הטכנולוגיות מצדיקות לחלוטין את הרכישה של גוגל ומקדמת אותה צעד נוסף לכיוון הרשת
הסמנטית.
אין תגובות:
הוסף רשומת תגובה