ניצול לטובה

חוקרים מאוניברסיטת קרנגי מלון מצאו דרך לרתום את מאות אלפי השעות שאנחנו מבזבזים ברישום לאתרים, לצורך העלאת ספרים לרשת

ניצול לטובה | חדשות 13

חוקרים מאוניברסיטת קרנגי מלון מצאו דרך להפוך את ה-CAPTCHA, אותו רצף תווים אקראי המשמש להרשמה לאתרים, לבעל תועלת תרבותית. במסגרת פרויקט חדש, reCAPTCHA שמו, יוכלו גולשים מכל העולם להקליד לא סתם תווים חסרי משמעות, אלא קטעים מתוך ספרים, וכך יסייעו למיזם הדיגיטציה הבינלאומי של הספרות העולמית - פרויקט גוטנברג.

החוקרים סבורים כי מדי יום נעשה שימוש בכ-60 מיליון אישורי CAPTCHA (ראשי תיבות של completely automated public Turing tests to tell computers and humans apart), אשר גובים מן המשתמש 10 שניות בפענוח והקלדה. מטרתם של מנגנוני הרישום הללו היא לוודא כי אכן מדובר באדם ולא במכונה, והם מיועדים בעיקר למניעת ספאם.

"האנושות מבזבזת 150,000 שעות מדי יום בהקלדת תווים חסרי משמעות", אמר לואי ון אהן, פרופ' למדעי המחשב מאוניברסיטת קרנגי מלון, בראיון לסוכנות הידיעות AP. הפרופ', שלקח חלק בפיתוח היישום לפני כשבע שנים, משוכנע שאת הזמן הזה אפשר לנצל אחרת, למשל להעלאת ספרים לרשת והפיכתם לנגישים לכל גולש (ומנוע חיפוש גם יחד) באינטרנט.

ון אהן עובד בשיתוף ארכיון האינטרנט, שמנהל כמה מיזמי סריקת ספרים. אך האתר, שסורק 12,000 ספרים מדי חודש, שולח לפרופ' מאות קבצי תמונה שהמחשב לא הצליח להמיר לטקסט באמצעות OCR. הבעיה העיקרית היא עם כותרים ישנים במיוחד או כאלו שנפלו קורבן לפגעי הזמן. את המילים המופיעות בתמונות מחלק ון אהן לקבצים בהם מופיעה מילה בודדת, אשר יכולה לשמש כ-CAPTCHA.