בתוך שבועיים: כך שינתה סירי את חיי
ביצוע חישובים מסובכים בזמן ריצה, הקלטת תזכורות מהמיטה בשעה מאוחרת או הכתבת הודעת טקסט בזמן נהיגה - תוכנת הזיהוי הקולי סירי מסתמנת כחידוש המרעיש של האייפון 4S ■ המתחרות, ובראשן גוגל עם מערכת האנדרואיד, כבר עובדות על מענה לפיתוח של אפל

>> לפני כשלושה שבועות השיקה אפל את האייפון 4S. כמו בהשקות קודמות, ציפו הצרכנים ל"קילר פיצ'רס" (תכונות שוברות שוק) כמו מהפכת האפליקציות של האייפון הראשון, או עיצוב חדשני כמו זה שאיפיין את האייפון 4.
החידוש המשמעותי של אייפון 4S הוא תוכנת הזיהוי הקולי סירי (Siri), המוגדרת על ידי אפל כ"עוזר אישי". היא מאפשרת לנהל תוך כדי דיבור את יומן הפגישות, לשלוח הודעות טקסט, לחפש באינטרנט ולאתר מקומות בילוי. טכנולוגיות זיהוי דיבור קיימות מאז 1952, ויושמו במחשבים כמו ה-Shoebox של יבמ ובטלפונים מבוססי סימביאן של נוקיה וחלונות 7 של מיקרוסופט, אך עדיין לא הגיעו לשימוש יומיומי צרכני נרחב. האם סירי תפרוץ את הדרך?
עד היום שיווקה אפל קונצפטים קיימים, כמו הטאבלט. בשלושת ימים הראשונים שבהם היה ניתן להזמין את המכשיר, נמכרו 3 מיליון יחידות מהאייפון 4S, לעומת 1.7 מיליון יחידות של האייפון 4 - מה שמעיד על כוח המשיכה של הסירי. הסירי היא החידוש העיקרי במכשיר.
בשבוע שעבר פרצו האקרים את הסירי והתקינו אותה על אייפון 4 ואייפוד - מה שמוכיח את ההתלהבות. פיצ'ר הזיהוי הקולי זכה גם לביקורות נלהבות מעיתונאי טכנולוגיה נחשבים. "סירי לא רק תחסוך זמן - היא תציל חיים", התפייט מתיו פנזרינו באתר TheNextWeb. לדבריו, סירי מאפשרת לדבר למכשיר כאילו היה בן אנוש, ללא צורך להתאים את אופן הדיבור לזה של מכונה, וזה סוד קסמה.
"ההגיון הקונטקסטואלי של סירי הוא מה שהיה חסר בזיהוי קולי בטלפונים. גוגל משלבת יכולות חיפוש קולי במכשיריה כבר זמן מה, אך אף אנדרואיד הוא לא האייפון 4S". הסירי מבוססת על פיתוח של Siri Assistant, שאותה רכשה אפל באפריל 2010 תמורת 200 מיליון דולר. הפיתוח הראשון של החברה בתחום זיהוי הקול מומן על ידי DARPA, הסוכנות הגדולה בעולם לאינטיליגנציה מלאכותית.
סירי נוצרה כאפליקציה חינמית לאייפון, המבצעת פעולות שונות למשתמש, בהן הזמנת מונית ומקום במסעדה. היא כוללת שתי מערכות - האחת מקשיבה ומתרגמת והשנייה מנתחת את המשמעות מאחורי הבקשה. התוכנה מבוססת על מנוע זיהוי הקול של Nuance.
ואולם באזז אינו מעיד בהכרח על טכנולוגיה מהפכנית. הסירי משולבת כתכונה אינהרנטית של האייפון, ולא דורשת כניסה לאפליקציה. עד כה הצטיינה אפל ביכולת להכתיב מגמות בשוק הסלולר, ולכן סביר מאוד שבדגמי הסמארטפון החדשים שייצאו לשוק בשלהי 2011 וב-2012 נראה יותר ויותר שילוב של יכולות זיהוי קולי, שיאפשרו לבצע פעולות במכשיר.
אופי צנוע וחברתי
אחד המחסומים הגדולים שמנעו מטכנולוגיית הזיהוי הקולי להפוך לשמישה היא התחושה הלא נוחה שמתלווה לשימוש בה, של 'דיבור אל הקיר'. כדי למנוע זאת, בחרו באפל בטון דיבור ידידותי, שנעשה בגוף ראשון. בחברה ניתחו את העדפות המשתמשים וגילו שאמריקאים מגיבים טוב יותר לקול נשי, ואילו בריטים מעדיפים קול גברי סמכותי - והתאימו את התוכנה. בסירי משולב לא מעט הומור, שכולל תשובות משעשעות לשאלות "האם תינשאי לי?", או "איפה אפשר להחביא גופה?".
"היו הרבה דיונים על ה'אופי' של סירי, ואם על היישום להציג בכלל אופי", הסביר נורמן וינרסקי, שותף מייסד ב-Siri Assistant. צוות הפיתוח ניסה ליצור עבורה אופי צנוע וחברותי, ולצד זאת לתת לה גם יכולת להציג אופי מעט נוקשה יותר.
"כשקיבלתי את האייפון 4S שיחקתי קצת בסירי, אבל לא חשבתי שבאמת אאמץ את הזיהוי הקולי ביומיום. עכשיו, אחרי שבועיים, אני כבר רואה כיצד היא משנה את הדרך שבה אני חיה את חיי", כתבה אליס המבורגר בביזנס אינסיידר לאחר שבועיים של התנסות בסירי (ראו מסגרת). המבורגר ציינה לטובה את האפשרות להקליט תזכורות מהמיטה בשעה מאוחרת, במקום להקליד אותן בחושך, וכן את היכולת להכתיב הודעת טקסט בנהיגה או בעת הליכה - מה שמפחית את הסיכוי לתאונות.
היא השתמשה בסירי להשמעת שירים בעת ריצה, לחיפושים בתיבת המייל ולחישובים מסובכים. "סירי נהפכה לאפשרות הראשונה לביצוע כל אלה, משום שהיא מקלה על העניינים", סיפרה המבורגר. לדברי אנליסטים, השילוב בין יכולת זיהוי הדיבור של סירי לאינטיליגנציה המלאכותית ולאינטגרציה במערכת ההפעלה, טומנת בחובה פוטנציאל מהפכני בממשק אדם-מכונה. היכולת לדבר בשפה פשוטה ולהבחין בין ניואנסים של קול היא התקדמות משמעותית.
מנגד, יש מבקרים הסבורים כי גורל סירי יהיה דומה לזה של Time-Face - תוכנת הווידיאו-צ'אט ששולבה באייפד 2, במק ובאייפון 4. למרות יישומים דומים שבאו אחר כך, כמו Hangouts בגוגל פלוס, שיחות הווידיאו לא חילחלו לחיי היומיום. "סירי היא הדבר המדהים ביותר שאף פעם לא אשתמש בו", כתב מאט הונאן מהבלוג הטכנולוגי גיזמודו.
הטענה המרכזית כנגד נבואות ההצלחה של סירי גורסת שטכנולוגיית הזיהוי הקולי בסירי עדיין לא בשלה. מבדיקת היישום עולה כי בתנאים לא מיטביים של חיבור לרשת, לוקח לו זמן רב לספק מענה. כמו כן, כדי לשלוח הודעה האייפון עדיין זקוק למחווה ידנית של אישור - כך שסירי לא משחררת לחלוטין את האצבעות. צ'ארלי וויט, עורך ב"משאבל" שבחן את המכשיר, מעיד כי סירי נוטה עדיין שלא לעבוד באופן רציף.
המתחרות לא מתבטלות
אפל מכנה את הגרסה הנוכחית "בטא" ומדגישה שתשפר אותה, ושלסירי יש יכולת ללמוד את אופן הדיבור של המשתמש עם הזמן. מחסום נוסף הוא השפה. סירי זמינה כרגע באנגלית, צרפתית, גרמנית וספרדית. ב-2012 צפויה אפל לעדכן אותה גם לאיטלקית, יפנית, קוריאנית וסינית. גרסה עברית לא צפויה בקרוב. ואולם גם דוברי השפות שסירי דוברת נתקלים עדיין בקשיים. בעלי מבטא סקוטי דיווחו שהיא לא מבינה אותם.
נראה כי הבשלות הטכנולוגית אינה החסם העיקרי בפני תפוצה רחבה של טכנולוגיית זיהוי הקול. כעת, כשאפל הנגישה את היכולות למיליוני צרכנים, יגבירו גם מתחרותיה את הקצב במירוץ. מיקרוסופט הציגה את שילוב יכולות זיהוי דיבור בקונסולת הקינקט ביוני 2011. בספטמבר הבטיחה החברה שתחשוף פריצת דרך בתחום זיהוי הדיבור, שעשויה להיות קשורה גם לתחום הסלולר.
לאנדרואיד יש כיום תכונת זיהוי דיבור בשם Voice Actions; ומוצעת אפליקציית עוזר אישי חינמית בשם Speaktoit המאפשרת שליחת הודעות טקסט, קביעת פגישות ופרסום בפייסבוק ובטוויטר. בשבועות האחרונים עלה קצב ההורדות שלה ב-400%, לעשרות אלפי הורדות. על פי "ניו יורק טיימס", האפליקציה הזו עוד רחוקה משמעותית מהסירי, אך עשויה בהחלט להוות יעד לרכישה על ידי גוגל.
פריצת הדרך הגדולה של סירי עשויה שלא להגיע דווקא מכיוון האייפון. בשבוע שעבר חשף האנליסט ג'ין מנסטר מבנק ההשקעות פייפר ג'פרי כי אפל מפתחת מכשיר טלוויזיה, שישלב שידורים חיים עם תוכן קנוי מהאייטיונס, ותוטמע בו גם תוכנת הסירי. חוויה שכזו, שמאפשרת לצופה לדבר לטלוויזיה וגם לקבל ממנה תשובות, מצטיירת כחוויה נחשקת שתמשוך מיליוני קונים לחנויות.



