יום ראשון, 18 במאי 2014

יתרונות וחסרונות הרשת בעסקים



1)     ישנם הרבה שימושים פוטנציאלים  להלן מס' דוגמאות מיידיות:

·         למח' מכירות: זיהוי לקוחות פוטנציאלים ויצירת קשר ראשוני ללא התערבות אנושית.

·          למח' שיווק:   סוכן חכם יכול לאסוף מידע שיווקי ממתחרים ולקבל החלטות ברמה שאנו נגדיר לו.

·         למח' משאבי אנוש:  חיפוש אוטומטי של כוח אדם

2)     מעקב גילוי והתערבות אוטומטיים – מעקב אחרי תהליכים גילוי תקלות והתערבות לתיקון התקלה ברמת יכולת שהוגדרה מראש.

3)     חשיפה נוספת לשוק -  יותר לקוחות חיצוניים רלוונטיים יחשפו ל"אוראנוס"

4)     חיסכון בשעות אדם, ייעול תהליכים – המחשב יוכל לבצע במקום אדם משימות  אדמיניסטרטיביות כגון: הזמנת כרטיסי טיסה, קביעת פגישות או חיפוש מידע. דבר זה יחסוך שעות אדם..

5)     הורדת העומס על רשת – הסוכנים החכמים יסרקו את הרשת בצורה ממוקדת למשימה שלהם וחזירו רק את האינפורמציה הרלוונטית והמתומצתת.

6)     שימוש יעיל ברוחב פס של הרשת – הסוכנים החכמים יעשו שימוש חכם  לניצול של רוחב הפס ע"י עיבוד והעברת אינפורמציה בצורה יעילה לפי הגדרות המשתמש.

7)     אדפטציה דינאמית – הרשת הסמנטית מבצעת עדכון עצמי ומתאימה את עצמה לסביבתה. לדוגמא: אם יצא חוק חדש שאסור לישראלים להמר דרך האינטרנט. אזי הרשת הסמנטית תחסום אתרים אלה לכל משתמש בעל אזרחות ישראלית.


1)     פשרה בין איכות האינפורמציה לזמן – כדי למצוא מידע יש צורך בחיפוש על גבי
דפי אינטרנט רבים. ולכן צריך להגיע לפשרה (
tradeoff) בין שתי אפשרויות הבאות:

                    I.      לחפש בדפים  רבים ואז האינפורמציה ש-Web server יציג תהיה "מליאה" אך אפשרות זו דורשת זמן רב ומשאבים רבים.

                  II.      לחפש "במעט" דפים, חיסכון בזמן ובמשאבים אך האינפורמציה תהיה "חסרה" ופחות מדויקת מזו שבאפשרות הראשונה

2)     יש צורך בהכשרה מיוחדת לחלק מהעובדים, כולל עובדי IT. זה נעשה על מנת שהעובדים ילמדו לתת הגדרות בצורה נכונה ולבנות אתרי אינטרנט עבור רשת סמנטית.

3)     שתי בעיות מרכזיות הקשורות במבנה האונטולוגי:

                    I.      מילים נרדפות – להבחין בין שתי מילים בעלות אותו פירוש, לדוגמא:  Baby/ Infant  שתי המילים מתכוונות לתינוק.

                  II.      מספר פירושים שונים לאותה מילה - לזהות מה הייתה כוונת המשתמש. לדוגמא: המשתמש הקליד את המילה "Bank". למילה זו יש 2 פרושים: מוסד פיננסי ושפת נהר.

4)     לא קיים סטנדרט ברור לתיאור אונטולוגיות – זה דורש מאמץ ראשוני לערוך מחדש את המידע בדפי האינטרנט.

סמנטיקה של גוגל


בשנים האחרונות גוגל עובר מהפכה אשר למעשה הופכת את היוצרות ומשנה את גוגל עצמו ממנוע חיפוש מבוסס קישורים, אל מנוע חיפוש המתחשב גם בהפניות סמנטיות ( שאינן קישורים טהורים ) וסיגנלים חברתיים. בעוד מגמה זו מתחזקת, הקישורים עצמם מאבדים מכוחם וגם החשיבות של מילות המפתח בתוך הקישור (Anchor Text) הולכת ופוחתת.
בתור ישראלים קשה לנו להבין זאת וגוגל ישראל אכן מפגר מספר שנים אחרי אחיו הגדול, אך מספיק להסתכל על העניין שהשינויים האלו יוצרים בקהילת ה -SEO העולמית, על מנת להבין עד כמה שינוי זה קיצוני ומרחיק לכת.

סמנטיקה
הסמנטיות שגוגל כל כך רודף אחריה היא בעצם זו שתאפשר לו בעתיד לזהות את ההקשר בו אנחנו מחפשים את  השאילתה. כבר כיום גוגל יודע שאם אנחנו נמצאים באזור מסוים בארץ ומחפשים "מסעדה" ללא ציון שם המקום, אנחנו כנראה מחפשים מסעדה שקרובה אלינו, ולכן הוא יציג לנו רק , או בעיקר, מסעדות כאלו. בעתיד, הסמנטיות הזו רק תלך ותתחזק אל מעבר למיקומים פיזיים, וגוגל יוכל לדעת טוב הרבה יותר מה אנחנו מחפשים לפי היסטורית החיפוש שלנו או הפעילות שלנו ברשתות חברתיות. במצב זה שבו הרשת תהפוך לאישית הרבה יותר, איזו חשיבות כבר תהיה להופעה במקום שלוש או ארבע?! חשיבות מועטה אם בכלל.
מעבר לכך, כל הקישורים שמקדמי האתרים בונים, ובעיקר אלו הלא אתיים מביניהם ("ספאמרים") מפריעים לגוגל בהבנת הסמנטיקה.

סמנטיקה בין דפים
מודל נוסף שיכול לעזור לגוגל הוא לימוד של הקשרים בין מילים באמצעות בחינת כל העמודים ברשת שמדברים על אותו הביטוי. אם גוגל למשל יבדוק ביטוי כמו "ים של דמעות" בצורה פשוטה, הוא עלול לחשוב שמדובר בים הנקרא "דמעות", אבל אם הוא יסרוק מספיק עמודים ברשת, הוא יבין שהמילה דמעות היא החשובה כאן ולמעשה מדובר בדמעות רבות שהן כמו ים סוער ורוגש. הוא יבין זאת באמצעות בחינה של משפטים קרובים שבוודאי יעסקו בפרידה כואבת או בטראומה כלשהיא בדפים המזכירים את הביטוי .
בכל אופן, ברגע שגוגל יבין את ההקשר הסמנטי המדויק בין מילים, הוא יוכל לנטרל דפים שמשתמשים בו בהקשר לא נכון, לדוגמה, דפים שנכתבים בצורה אוטומטית ולא מזכירים סיטואציות שמתאימות לביטוי "ים של דמעות" .
כיום, הדוגמה הטובה ביותר לסמנטיקה בין דפים היא גרף הידע, גרף אשר מציג עובדות שמתקבלות מסינטזיה של דפים שונים ברשת.
טענה מעניינת נוספת בנוגע לסמנטיקה בין דפים, גורסת כי מספיק לאזכר דף אחד ברשת בצורת URL (ללא קישור) או הכותרת שלו (TITLE), על מנת שגוגל יבין את ההתייחסות וההקשר גם ללא קישור פעיל. גוגל למעשה מטילים כאן את המודל האקדמי של ציטוטים וביבליוגרפיה על הרשת  כולה. למרות ההיגיון שיש בטענה הזו, סביר להניח שלגוגל אין עדיין את יכולת החישוב הנדרשת לשם כך.

כלים סמנטיים
ברשת ישנם כלים סמנטיים רבים שיכולים למצוא הקשרים בין מילים ומושגים שונים, וכך לעזור לנו ביצירת התוכן לאתר מותאם הסמנטיקה שלנו.  כן, אם כיום אנחנו מדברים  על אתרים שמתאימים לקידום, בעתיד ייתכן כי נדבר על אתרים המתאימים לסמנטיקה.

אתר סמנטי
לאחר כל זאת, כיצד אנחנו הופכים אתר לאתר סמנטי יותר? וובכן, ישנן כמה שיטות מומלצות שבוודאי יהיו מוכרות לחלקכם מעולם התוכן :
  • שימוש במילים נרדפות בכותרות ראשיות, כותרות משנה, קישורים , כתובות ידידותיות למנועי חיפוש וכו'.
  • בהקשר של קישורים, מומלץ ואף רצוי לקשר באמצעות מילים נרדפות אל עמודים שכוללים את המילים האחיות למילים נרדפות אלו (לדוגמה – "דירות בבאר שבע" מקשר אל עמוד של פרויקט נדל"ן ספציפי ולא אל עמוד שמדבר ישירות על "דירות בבאר שבע")
  • בעברית, אפשר להשתמש במספר גרסאות של אותה המילה ביחיד , רבים, עם או בלי אותיות בכל"מ

 

 

רשצ סימנטית פותרת בעיות





כיום האינטרנט מהווה אוסף גדול מאוד של דפי מידע. כאשר משתמש צריך אינפורמציה מסוימת הוא אוסף\עורך את דפי המידע הדרושים לו  ובמידת הצורך מבצע שינויים מסוימים מתוך תהליך של קבלת החלטות.

לדוגמה: המשתמש רוצה להזמין כרטיס טיסה ליעד מסוים במחיר מסוים. הוא עורך חיפוש באינטרנט דרך לפחות אתר אחד עד למציאת הכרטיס המתאים.

 פעולות אלה דורשות זמן, ידע ומאמץ מצד המשתמש ולעיתים קרובות כרוך התהליך בטעויות אנוש כתוצאה ממידע חסר. המחשב איננו מסוגל לבצע פעולות אלו כיום.




הפתרון המתאים ביותר לדעתנו הינו מעבר לטכנולוגיית “Semantic web”. "“Semantic web – זו טכנולוגיה חדשה המכונה הדור הבא של אינטרנט, בעלת "אינטליגנציה מלאכותית" המאפשרת למחשבים לקבל החלטות ולבצע פעולות בצורה אוטומטיות ויעילה.

הרעיון של רשת סמנטית הוצע לראשונה בסוף שנות ה-90 ע"י ,Tim Berners-Lee אותו מדען הינו גם אביו-מולידו של ה- WWW ועכשיו עומד בראשו של ה- World Wide Web Consortium (W3C). כאשר מדברים על רשת סמנטית הכוונה למבנה בעל נפח משמעותי שמבחינה תוכנית הוא מובן למכונות. המשימה העיקרית של הרשת הסמנטית  תהיה הוספת נתונים מיוחדים לדפי הרשת כך שיאפשרו לתוכנות להבין עמודי WEB.  כאשר דפדפן ילמד ויבין על מה מדובר בעמוד WEB נתון שהוא פותח זה יגדיל את יעילות העבודה עם משאבי WEB, המחשבים בעצמם יוכלו למצוא מידע שאנחנו צריכים ובעצמם לסנן תוכן שדומה מילולית אך שונהבמשמעות,  ועל הבסיס הזה יוכלו אח"כ לבצע באופן אוטומטי משימות שונות.

עד עכשיו ישום של רשת זו  התבצע בעיקר באוניברסיטאות, במכוני מחקר ו-BigBlogZoo   שהוא מנוע החיפוש הראשון שמשתמש בטכנולוגיה זו, הוא מחבר פורומים, קהילות ובלוגים.

דוגמאות למשימות שניתן לבצע ב- Semantic web”":

1)     המשתמש –  בונה רשימה שמית של ימי הולדת של קרובי משפחה, מכרים וחברים להם הוא רוצה לתת מתנה ביום הולדתם. לכל שם ברשימה מופיע תאריך יום ההולדת, עיסוק, רף עליון לסכום הכסף של אותו יוציא לקניית מתנה וכד'. לפי הפרטים האלה המחשב בוחר מתנה ושולח אותה לאדם המתאים בתאריך המתאים ליום הולדתו. 

2)     A נמצא בתל-אביב ורוצה להיפגש עם B שנמצא בניו יורק. המחשב מתאם את הפגישה בין השניים ולצורך זה מבצע פעולות הבאות:

                                I.      בודק ביומן פגישות של A ו- B מתי הם פנויים

                              II.      רושם את הפגישה ביומנים

                            III.      מזמין כרטיסי טיסה ל- A לפי ההגדרות של A (זמן, מחיר וכו')

                           IV.      מזמין מקום לפגישה במסעדה בניו יורק

                             V.      מזמין מכונית שכורה ל- A שתמתין לו בשדה התעופה

                           VI.      מזמין חדר במלון ל - A (לפי ההגדרות של A)

אונטולוגיות וסוכן חכם




אונטולוגיות (מיוונית Ontos – משמעות)  זוהי שפת הבסיס של הרשת הסמנטית. היא מתארת  הגדרות בכל תחום נתון ומהי מהות היחסים בינהם בשפה פורמלית.  מכיוון שאונטולוגיות זה מידע על מידע – נוצר מתא דתה.

אונטולוגיות עשויות להתפתח לשימוש בפתרונות של משימות שונות, כולל שימוש בשיתוף פעולה בין אנשים ומכונות על מנת לאפשר שימוש חוזר של ידע בתחום מסוים , להקמת מודלים ותוכנות שמפעילים אונטולוגיות ולא מבני נתונים קשיחים.

אונטולוגיות מגדירה קלאסיפיקציות (Classes) כל Class מכיל Subclass. Class נראה כאוסף של תכונות שמתארים הגדרה מסוימת. כל ה- Classes נמצאים באחת או כמה היררכיות שמתארות הגדרות של תחום מסוים.

 
על מנת לבצע את הפעולות ברשת בסמנטית משתמשים בסוכנים חכמים. סוכן חכם הוא תוכנה שמותאמת לתחום מסוים. לדוגמא: קביעת פגישות, הזמנת כרטיסי טיסה. הסוכנים החכמים מקבלים החלטות בעזרת המידע מהרשת הסמנטית ומבצעים פעולות במקום בני-האדם.
בנוסף לכך, הם לומדים את ההיסטוריה של המשתמש ולפיה מציגים לו תוצאות רלוונטיות. לדוגמא: מילוי טפסים דרך האינטרנט. הסוכן החכם "הולך" להיסטוריה של המשתמש ולפיה ממלא את הטפסים. על מנת להשתמש בסוכנים החכמים יש צורך להתקין אותם אצל משתמש הקצה.
 
 
 

רקע טכנולוגי




 

הבסיס של הרשת הסמנטית מכיל שלוש טכנולוגיות העיקריות: שפות XML, OWL והוספת  חוקים בשפת ה- RDF. XML מגדיר סינטקס כללי לסטרוקטורות סמנטיות כסטנדרט יחיד להיפר טקסטים. בתוך משפטים של XML תהיינה רשומות סמנטיות שכוללות מידע על משמעות המסמך  באופן שמובן למכונה.

 RDFResource Description Framework, זהו אוסף חוקים המגדיר צורת כתיבה של  רשומות סמנטיות.  

OWLWeb Ontology Language זוהי שפת האונטולוגיות. בעזרתה אפשר ליצור ולהשתמש במילונים סמנטים.

הקונצפציה של Semantic Web הינה הדרגה הגבוהה ביותר של קלסיפיקציה של המידע דבר שהופך עבודה משותפת של אנשים ומחשבים לאפקטיבית יותר. ההבדל העיקרי בין Semantic    Web  ו- Web  הוא שכל עמוד ברשת הסמנטית מכיל מידע בשתי שפות: אחת רגילה, שברורה למשתמש הקצה האנושי ושניה מיוחדת שבה המידע כביכול חסום לעיניו של משתמש הקצה, אך ברורה לתוכנות – סוכנים אינטלקטואלים, רובוטים. זוהי שפה מיוחדת המתארת את התוכן המוצג בעמוד בעזרת תגים ואטריביוטים המובנים למכונות.

ברעיון של רשת סמנטית יש שלושה עקרונות: אגרגציה, אבטחה ולוגיקה. משמעותה של האגרגציה היא שימוש משותף בנתונים בפתרון של משימה ב- Semantic Web  כל סוגי הנתונים יכולים להיות בשימוש. לנתונים הללו מוגדרת מידע באופן סמנטי ע"י אונטולוגיה (Ontology) מתאימה המאפשרת להשתמש בהם לפי הצורך  הגישה לנתונים נעשית ע"י SPARQL שהיא שפת שאילתות.

העיקרון של האבטחה מאפשר קיומן  של הרשאות על הרשת הסמנטית ומכיל חתימות דיגיטליות, לצרכי שימוש של תוכנות לבדיקת מידע, כך שנוכל לקבל אימות לנתונים שקיבלנו שהם אכן הגיעו  ממקור אמיתי, לדוגמה: שרות ציבורי כלשהו או מסוכנות פרטית דרך משתמש אחר.

עקרון הלוגיקה משמעותו פרוטוקולים, שפת לתאור עמודים ואוסף חוקים שקובעים כיצד יראו מבני הנתונים. הלוגיקה הזאת היא זו שנותנת לרשת סמנטית הגדרות למתודולוגית בה יבחר אופן ביצוע הפעולות עם הנתונים.

יום ראשון, 11 במאי 2014

גם כן שיטה להכין מפות מידע

מיפוי סמנטי/רשת סמנטית היא גם כן שיטה להכין מפות מידע


בשונה ממפת מושגים הוא מובנה יותר, הקשרים מוגדרים, ויש בו הגדרת קטגוריות.
התהליך הזה קבל תאוצה בשנים האחרונות, מכיוון שהסתבר שהוא יוכל לשמש כנראה בסיס למערכות של אינטליגנציה מלאכותית, ומחקרים רבים בעולם עוסקים במיפוי סמנטי לצורכי המחשב.
יש כיום גם תוכנות שעושות זאת, ואחת מהן פותחה על ידי פישר ועמיתיה.
גם כאן המידע מסודר בצמתים (מושגים המבוטאים באמצעות מילה או משפט), ובקשרים שביניהם.

את המערכת מתחילים ממושג מרכזי (למשל - כלב), ואליו מחברים בקשרים מושגים קרובים (למשל : שייך לקבוצת היונקים, יכול להיות מבוית, יכול להיות בר, גדל בכל העולם, אוכל בשר).

איך נציג את זה במיפוי סמנטי?
הקריאה של מפה כזה היא מהמרכז - מהמושג המרכזי אל הקשרים ומהם החוצה, למושגים הקרובים.
מושגים מגדירים אחד את השני. ניתן בהרבה מקרים להבין מושג דרך הקשרים שלו למושגים אחרים.
למשל : אוכל בשר, מבוית או בר, יונק ומפוזר בכל העולם מגדירים כלב. אבל המושגים האלו מגדירים גם חתול, ולכן, צריך להוסיף עוד מושג שיהיה יחודי לכלב ויזהה אותו. מושגים כאלו נקראים תכונות מבדילות.
הקשרים מסומנים בחיצים והם בעלי כיוון ומורכבים ממילים או משפטים המגדירים את היחס בין שני המושגים.

קיימים כמה סוגי קשרים אפשריים :

א. קשר סימטרי - כיוון החץ המחבר בין המושגים אינו משנה את הניסוח של הקשר (למשל : ראש מחובר לצוואר. ובכיוון הפוך : צוואר מחובר לראש)

ב. קשר א-סימטרי - כיוון החץ המחבר בין המושגים משנה את הניסוח של הקשר (למשל : יונקים כוללים לוויתנים ובכיוון הפוך : לוויתנים הם חלק מהיונקים)
מהמבנה הראשוני ניתן לעשות כמה פעולות :
  • ניתן לבחור כל מושג קרוב כמושג מרכזי למפה משלו, ולקשר בין המפות. המבנה הזה יכול להיות מוצג בצורה הירארכית, כאשר יש קשרים בין המפות השונות.
  • ניתן להגדיר קטגוריות של מושגים, ולטפל בכל קטגוריה במפה משלה.
בכל מקרה חייבים להגדיר מתי להפסיק את התהליך, כי הוא בעצם אינסופי. התנועה ממושג למושג תביא אותנו למפות רחוקות ולמושגים שרחוקים מאד מהנושא הראשוני שלנו. למשל : נניח שאנחנו רוצים לעשות רשת סמנטית למונח המרכזי "כדור הארץ" . בין המושגים הקרובים נמצא שיש לו ירח, הוא עגול, יש בו ימים ויבשות ועוד. עכשיו ניקח את המושג ירח, נהפוך אותו למושג מרכזי, ונמצא שבין המושגים הקרובים אליו יהיו: אין עליו מים, הכבידה עליו היא ששית מכבידת כדור הארץ, יש כזה גם לכוכבים אחרים ועוד. המושג המרכזי הבא יהיה כוכבים, ופה נמצא שהם ממלאים גלקסיות, ויש כוכבים גם בהוליווד. אם נמשיך וננתח את המפה של הוליווד נמצא שיש בה נושאים מעניינים מאד, אבל, למי ששכח - הנושא שעניין אותנו הוא "כדור הארץ", כך שהתרחקנו ממנו כבר יותר מדי (ואולי לא.....).
גם כאן כמובן כדאי להשתמש בצבעים, סימנים וציורים שיקלו עלינו את התהליך ואת הזכירה.
שרטוט רשת סמנטית הוא שילוב בין הדברים שאנחנו יודעים על הנושא עוד לפני הלמידה, והדברים שנלמד. אנחנו משלבים ידע חדש בתוך תבנית קיימת, וכבר הראינו שזו נחשבת לשיטת הלמידה הטובה ביותר.
המקומות בהם לא נוכל להסביר את טיב הקשרים, או מושגים שישארו ללא קשרים יצביעו עבורנו על מה שאנחנו צריכים עוד ללמוד.
התוצאה הסופית של כל התהליך היא הבנה של כל המושגים וכל הקשרים בנושא שאותו חקרנו. הצורך להגדיר את הקשרים, למצוא קשרים חדשים, ולראות את מבנה הרשת, יוצר את תהליך הלמידה שלנו.