הושקה גירסה בטא 2 של מנוע החיפוש אומגילי

המפתח הישראלי רן גבע השיק היום גירסה מתקדמת יותר של מנוע החיפוש המתמחה בדיונים מקוונים. יציג לראשונה תוצאות ממערכות פורומים בעברית

"אם מישהו רוצה ללמוד באופן כללי על נושא מסויים, אז שילך לחפש בגוגל. אבל אם יש לו שאלה נקודתית בנושא מסוים, שסביר להניח שכבר מישהו שאל אותה בעבר, אזי כדאי לו מאוד ללכת לאומגילי", כך אומר רן גבע, המפתח ישראלי שהשיק היום את גירסת בטא חדשה של Omgili(קיצור של Oh My God I Love It) - מנוע חיפוש המתמקד בחיפוש בפורומים.

בניגוד למנועי חיפוש רגילים, כמו אלו של גוגל, MSN או יאהו, המציגים תוצאות חיפוש מכל דפי האינטרנט, באומגילי תוצאות החיפוש מגיעות אך ורק מדיונים. ההתמקדות במדיום ספציפי משפיעה על אופי תוצאות החיפוש המתקבלות. בעוד שחיפוש במנועים רגילים יעלה לרוב בראש תוצאות החיפוש אתרים רשמיים או אתרים מסחריים, חיפוש במנוע חיפוש המתמקד בפורומים, מעלה דיונים הבנויים לרוב משאלות ותשובות. כך, ניתן למקד את החיפוש בחלקי הרשת בהם מרוכזים מגוון רב של דעות וכיווני מחשבה במקום אחד.

באופן מפתיע, למרות שהפורומים הם מדיום ותיק שקיים ברשת זמן רב לפני הבלוגים, עד כה לא היה פתרון מוצלח לחיפוש בהם, וזאת בניגוד לבלוגים שזוכים לשלל מנועי חיפוש. אומנם לגוגל קיים שירות הנקרא Google Groups, אולם זה מחפש אך ורק בקבוצות דיון ב-Usnet, מדיום ותיק הקיים מאז 1981 ואשר הולך ונעלם בשנים האחרונות. אומגילי, בניגוד לשירות של גוגל, מחפש בפורומים מבוססי רשת, מדיום תוסס שלא מפסיק להוכיח כי הוא חי ובועט.

חיוני במיוחד לחיפוש בפורומים בעברית

אומגילי פעיל כבר מתחילת השנה, והיום (ב'), כאמור, העלה גבע את גרסת הבטא השניה שלו. "כשמנוע החיפוש עלה לראשונה לאוויר, קיבלתי עליו ביקורות טובות, אבל הדבר דווקא עורר אצלי חששות. הבנתי שהמנוע לא יוכל לעמוד בעומס גדול ושהוא לא מתקדם מספיק כדי לעמוד בדרישות הגולשים. לכן החלטתי שבנתיים לא אפרסם אותו יותר ושאעבוד בשקט על הגרסה החדשה שלו". עד כה מספר המשתמשים באומגילי לא עלה על כמה מאות ביום, אולם כעת, עם הגרסה החדשה, מקווה גבע כי המספרים יטפסו לכמה מליונים.

עבור הקהל הישראלי, החידוש המשמעותי ביותר בגרסה השניה הוא התמיכה בריבוי שפות, המאפשרת לחפש בין היתר גם בתוך שלל פורומים דוברי עברית. מעתה ישנו כלי אחד המאפשר לחפש באמצעותו בו זמנית הן במערכות פורומים גדולות כמו הייד-פארק ופרש, והן בתוך עשרות מערכות פורומים קטנות אחרות המתמקדות בנושאים ספציפים, כמו כדורגל, סטודנטים באוניברסיטת בן גוריון או נגינה על גיטרה.

למרבה הצער, דווקא מערכות הפורומים של הפורטלים הגדולים בארץ, כמו אלו של תפוז או נענע, לא מאונדקסות. גבע מסביר את היעדרם במבנה הבעיתי של פורומים אלו: "בישראל יש נטיה לבנות פורומים במבנה של עץ ולא במבנה לינארי, כפי שמקובל בעולם. המשמעות היא שלא כל טקסט הדיון מופיע בדף ה-HTML של הפורום, אלא ההודעות נפתחות בצורה מדורגת רק לאחר התערבות המשתמש. אני מקווה כי בעתיד אוכל לפתור את הבעיה ולתת לקהל הישראלי כלי לשליפת מידע מתוך הסצנה הגואשת שקיימת במערכות הפורומים הללו".

ניתוח דיונים

מבחינה עיצובית, דף החיפוש של אומגילי דומה מאד לדפי החיפוש של גוגל ושל יאהו. "רציתי לתת לאנשים ממשק נוח ומוכר ולא לסבך אותם עם ממשק חדשני במיוחד", מסביר גבע. יחד עם זאת, יש לאומגילי כמה מאפיינים יחודיים שנגזרים מהעובדה שהוא מתיחס לכל דף, לא כעל טקסט שטוח, אלא כעל דיון עם מבנה פנימי.

בעוד שבסיס האלגוריתם של גוגל נמצא מדד ה- Pagerank, הקובע את הפופולריות של הדף ביחס לדפים אחרים, כאן סדר תוצאות החיפוש נקבע על פי המקום בדיון שבו נמצאת מילת החיפוש, בין אם זה בכותרת של ההודעה הראשונה, בגוף הטקסט של ההודעה הראשונה או בתשובות. דיונים שבהם מילת החיפוש תימצא בכותרת שלהם, יופיעו מקום גבוה יותר בתוצאות החיפוש, על פני דיונים בהם היא תימצא אי שם בתחתית רשימת התגובות.

כל אחד חולם

פיצ'ר שהתווסף בגרסה השניה, מאפשר למשתמשים גם לסנן את תוצאות החיפוש שלהם ולקבוע בדיוק היכן מילת החיפוש צריכה להימצא. לחיצה כפולה על מילה בתוך תיבת החיפוש מקפיצה אות i קטנה. עמידה על ה-i פותחת חלונית עם כלי הסינון המאפשרים לקבוע את מיקום מילת החיפוש בהיררכית הדיון. בבדיקה עלה כי אומנם כלי זה עושה את המוטל עליו ומצליח במלאכת הסינון, אולם למען האמת, התקשנו למצוא תסריטי שימוש בהם הוא חיוני במיוחד.

עוד עלה בבדיקה כי תוצאות החיפוש מעודכנות למדי וכי ניתן למצוא דיונים שעוסקים בנושאים עכשויים כמו מבצע "גשמי קיץ", תוצאות משחקי שמינית הגמר במונדיאל ויציאת הסרט החדש בסדרת סופרמן. יחד עם זאת, אין באומגילי דרך לדעת מה תאריך הדיון או למיין את תוצאות החיפוש על פי תאריך.

גבע אומר כי ההחלטה לא להכניס את התאריך היתה מודעת וכי זו פשרה שעשה במטרה לכלול כמה שיותר פורומים באינדקס. "כל מערכת פורומים מציגה את התאריך במקום אחר ואין לי דרך להיות בטוח שהתאריך המופיע בדף הוא תאריך פרסום ההודעה ולא סתם תאריך שהגולשים כתבו. מכיוון שאותי מעניין יותר המידע עצמו ופחות מתי הוא פורסם, העדפתי לוותר על התאריך וכך להצליח להתמודד עם מגוון גדול יותר של מערכות פורומים".

אשר למספר תוצאות החיפוש המתקבלות, גבע אומר כי מספר הפורומים והדיונים המאונדקסים, גדל עם הזמן. נכון לעכשיו, מאונדקסים באומגילי כמאה אלף פורומים עם כמה עשרות מליוני דיונים. על הוספת הפורומים והדיונים אחראים הרובוטים של מנוע החיפוש. בעלי הפורומים שאינם מופיעים במנוע, מוזמנים לזרז את תהליך הוספתם ולשלוח לינק של הפורום דרך טופס יעודי.

עוד חידוש הקיים בגרסה החדשה של המנוע הוא האפשרות הפתוחה בפני בעלי פורומים להוסיף בתוך הפורום שלהם תיבת חיפוש של אומגילי. תיבה זו יכולה להחליף את החיפוש הפנימי הרגיל בפורום. היתרון של תיבת חיפוש כזו הוא שכך העומס הנוצר כתוצאה מהחיפוש, שלעיתים עלול להיות רב מאד, לא נופל על שרתי הפורום אלא על שרתי אומגילי. בעלי פורומים יכולים גם לעצב את מראה תוצאות החיפוש המתקבלות בתיבה זו ולהתאים אותן לשפה העיצובית של הפורום שלהם.

נכון לעכשיו גבע לא צופה הכנסות ממנוע החיפוש, אולם אין הוא חושש. כבר עכשיו הוא מתפרנס מפיתוחים שעשה בתחום שיתוף קבצים כמו Peer2Mail, Maileet ו-Sigster. בעתיד, כך הוא צופה, הוא ישלב באומגילי מנגנון פרסומות תלויות הקשר, בין אם מנגנון AdSense של גוגל או מנגנון שיפתח בעצמו, אולם הדבר יהיה רלוונטי רק כשמספר הגולשים ביום יגיע למספר נכבד של כמה מליונים. אשר לשאלה האם הוא חולם שיום אחד תקנה אותו חברה כדוגמת יאהו או גוגל, עונה גבע: "כל אחד חולם".