ארכיון לקטגוריה בלשנות חישובית

יש למישהו פרגמטיקה למכירה?

לא בדיוק בלשנות, אבל בהמשך לפוסט על מנוע החיפוש הסמנטי Powerset, הגיעו עכשיו החדשות הצפויות: מיקרוסופט קונה את פאוורסט. הפוסט בבלוג שלהם שבו הם מסבירים את העסקה נשמע כמו משהו שאפשר לתמצת בארבע מילים: "היינו צריכים את הכסף".

אין לי שום כוונה להסתיר את חוסר החיבה שלי (אם לנסח את זה בעדינות) למיקרוסופט ולמוצרים שלהם (ולמי שתוהה, אני מסתדר נהדר בלי אף תוכנה שלהם). בהקשר של פאוורסט, אני יכול רק לקוות שהמעבר לידיים של מיקרוסופט לא יוליד בסופו של דבר עוד זוועה בנוסח ה-paperclip הנורא, שאולי (?) היה לו איזשהו ידע סמנטי מאד בסיסי, אבל היתה לו גם בעיה לא קטנה בפרגמטיקה. כמו שכל סטודנט לבלשנות יודע, לא מספיק לדעת את המשמעות המילולית של מילה או של משפט, צריך גם לדעת באילו תנאים מתאים להשתמש בהם: מי שבתשובה לשאלה "יש לך שעון" עונה פשוט "כן", מבין אולי את התוכן המילולי (הסמנטיקה), אבל לא מבין את תנאי השימוש בתוך הקשר (הפרגמטיקה). כלל בסיסי בפרגמטיקה, אחד מכללי השיח של Grice, הוא כלל הכמות: תן בדיוק את כמות האינפורמציה הנחוצה, לא יותר ולא פחות. זו כנראה אחת הבעיות שממנה סבל אותו יצור מעצבן ב-Office, שלא היסס בכל הזדמנות לספק אינפורמציה חיונית כמו "It looks like you're writing a letter", ושהצליח להוציא מדעתו כל מי שאי פעם השתמש בתוכנה הזו, כמו שמעידה כמות הפארודיות (למשל, זו, זו, זו או זו). יש כמובן גבול למידת האינטיליגנציה שלה אפשר לצפות; אבל למגבלות הטכנולוגיות הצטרפו כנראה גם שיקולים לא ממש מקצועיים, כמו הרצון להמשיך ולשווק מוצרים שאשת הבוס היתה מעורבת בהם. בקיצור, אני יכול רק לקוות בשביל פאוורסט שהם יצליחו, למרות כל זה, להפוך את הטכנולוגיה שלהם למשהו שלא ייראה כמו עוד מוצר של מיקרוסופט.

אמרתי שזה לא בדיוק פוסט על בלשנות, לא?

אין תגובות 

מנוע חיפוש סמנטי: מה זה אומר?

מנוע חיפוש חדש שנחשף לאחרונה, Powerset, מעורר עניין רב בכלי התקשורת, כשהחידוש הגדול שבו הוא היותו "מנוע חיפוש סמנטי". מה זה אומר? מדובר במנוע חיפוש שעושה שימוש בכמות מרשימה של ידע בלשני לשם "הבנה" של הטקסט, דבר שאמור לאפשר חיפוש חכם שחורג מעבר לאיתור מילות המפתח שהקליד המשתמש. במידה ומנוע חיפוש מסוג זה יוכיח את עצמו כשימושי ויעיל יותר ממנועי החיפוש הקיימים, יהווה הדבר הוכחה נוספת לכך שגם למחקר בתחום תיאורטי כמו בלשנות יכול להיות ערך מעשי. המשך »

9 תגובות 

תרגום סימולטני באמצעות מחשב?

מישהו בפנטגון רואה כנראה יותר מדי סרטי מדע בדיוני. לפי דיווח של Associated Press שהתפרסם ביאהו, בוחן צבא ארה"ב שימוש בתוכנה לתרגום בזמן אמת של שפה מדוברת מאנגלית לערבית ולהיפך; ההערכה שמופיעה בכתבה צופה שהתוכנה תיכנס לשימוש לא לפני 2009 – הערכה אופטימית ונאיבית באופן תמוה, לדעתי. שווה להציץ בתגובות ב-slashdot לכתבה, שרובן תמימות דעים שמדובר בתוכנית בלתי מציאותית עד כדי גיחוך. המשך »

2 תגובות 

"בלשנות? מה אפשר לעשות עם זה?"

אחת השאלות שבהן נתקל כל מי שלמד או לומד בלשנות היא "אבל מה אפשר לעשות עם זה?". בואו נהיה מציאותיים: מדורי הדרושים בעיתון לא בדיוק עמוסים במודעות ענק של "דרוש בלשן"; חיפוש מודעות הכוללות את המילה "בלשנות" באתר AllJobs.co.il שביצעתי בזמן כתיבת פוסט זה הניב תוצאה אחת ("לשלוחתנו בכרמיאל, הנמצאת בתהליך גידול מואץ דרוש/ה מומחה/ית טקסונומיה – ידע נרחב במערכות חיפוש ממוחשבות. נסיון בהגדרת מערכות קטלוג או סווג – יתרון. אנגלית ברמת שפת אם. MA בפילוסופיה, בלשנות או אנגלית."). אז במה בעצם עובדים בסופו של דבר כל אלה שלמדו בלשנות? המשך »

תגובה אחת 

לשמוע מה שרוצים לשמוע

לפני שתקראו את ההמשך, הקשיבו קודם כל כמה פעמים להקלטה הקצרצרה הזו. מה נאמר שם?

מסתבר שהקטע הזה עורר סערה קטנה בארה"ב. מדובר בספר אינטרקטיבי לילדים, שבו לחיצה על כל אחד מהכפתורים משמיעה קטע אודיו קצר. אחד הכפתורים משמיע מה שאמור להיות קולה של אחת הדמויות, שאומרת "Uh oh, who has to go?". אלא שבשל איכות ההקלטה הגרועה, יש מי ששמע דווקא "Uh oh, who wants to die?". יחי ההבדל. המשך »

2 תגובות 

גוגל ככלי למחקר בלשני?

פוסט באתר Language Log השבוע התייחס למגבלות של שימוש בגוגל ככלי עזר למחקר בלשני. ההסתייגות שם (המבוססת בעיקר על הפוסט הזה והזה) היא בעיקר מחוסר האמינות של המידע הכמותי המתקבל מתוצאות חיפוש בגוגל, המוביל לכך שלא ניתן להשתמש בחיפושים בגוגל כדי להסיק מסקנות חד-משמעיות בדבר התדירות היחסית של ביטויים או צירופים שונים. למעשה, זוהי רק אחת מתוך מספר רב של מגבלות שמהן סובל השימוש בגוגל ככלי למחקר בלשני; בניגוד להסתייגות מאמינות המידע הכמותי, מגבלות אחרות רלוונטיות גם למי שהמחקר שלו על השפה אינו כמותי. המשך »

אין תגובות 

רכישת שפה ולמידת שפה אוטומטית

בעיתון "הארץ" התפרסמה אתמול ידיעה על צוות חוקרים מאוניברסיטת תל-אביב ומאוניברסיטת קורנל שפיתחו מערכת ממוחשבת המסוגלת ללמוד שפה טבעית ללא הדרכה וללא "דקדוק מולד", רק על סמך חשיפה לקורפוס של טכסטים. השאלה שמתעוררת היא האם דבר זה מערער את היסודות שעליהם מושתתת השערת המולדות המקובלת על-ידי חלק גדול מהבלשנים הגנרטיביים. המשך »

9 תגובות