Feeds:
פוסטים
תגובות

Archive for the ‘גרמנית’ Category

כתבי השטח שלנו חורשים לאחרונה את הארץ לאורכה ולרוחבה, בעיקר לרוחבה, כדי ללמוד ממיטב כנסי הבלשנות שיש לקהילה הישראלית להציע.
יובל נכח לאחרונה בסמינר הבלשנות החישובית ISCOL וחלק עמנו מרשמיו הרבים ב טוויטר .
ומהיום ולמשך שאר השבוע אהיה אני באוניברסיטה העברית לכנס Roots ‎3 (או בשמו הרשמי: Approaches to the Lexicon‏) שמתמקד במורפולוגיה ובממשקיה עם התחביר. גם התרשמויותיי יצויצו; צריך רק ללחוץ כאן ולקרוא. אם אתם בסביבה אתם מוזמנים לבוא ולומר שלום. היום אקל עליכם את הזיהוי – אני לובש חולצה‎ ‎של קומיקס דינוזאורים .

ובינתיים, אחרי שנהניתי ממיטב פקקי ארצנו, הגעתי באיחור קל להרצאת הפתיחה של היידי הארלי מאונ' אריזונה, מבט מקיף ומאלף על השורש במובנו הבסיסי ביותר. יאללה בלגאן.

Posted by Wordmobi

Read Full Post »

שחר שואלת לפשר הביטוי "דפק לו ברז" והאם ישנם ביטויים דומים בשפות אחרות עבור מה שקורה כשמישהו לא מגיע לפגישה. היא גם נידבה מספר ביטויים כאלה בעצמה, ובכך חיבבה עצמה מאוד על העורכים שמעט עבודה נחסכה מהם. נתחיל עם הממצאים, ובראשם אלו שהיא מצאה:

  • בצרפתית (בלגית, ואולי בצרפתית בכלל) אומרים "הניח ארנב".
  • בערבית אומרים "הצית" [לא הכרתי – א"ק].
  • ברוסית ישנם ביטויים שונים, תלוי את מי שואלים ומאיזה דור הוא. ישנו ביטוי ישן שמשמעו להתניע דינמו לשווא.
  • בסוואהילי אמרו לה "שזה משהו גס שלא מוכנים לתרגם לי מילולית".
  • באנגלית – stood me up, "העמיד אותי".

מספר ממצאים משפות נוספות שליקט מדור חיפוש קרובים בבלוג:

  • בספרדית ארגנטינאית אומרים hizo la pera, כלומר "עשה את האגס".
  • בגליציאנית אומרים darlle plantón, "נתן לו עציץ גדול".
  • בצ'כית אומרים ulejt se, "שפך קצת מעצמו".

וכן הלאה וכן הלאה, עד בלי די, באושר ועושר עד עצם היום הזה. קוראינו מוזמנים להוסיף בתגובות (נגיד, אם יש קוראי פרסית בקהל). למי שתהה, לגרמנים אין מילה ל"להבריז מפגישה".

ועכשיו להתקלתה של שחר:

רציתי לשאול את כותבי הבלוג אם הם מכירים עוד ביטויים בשפות שונות למושג זה? והאם אתם יודעים את המקורות לביטויים הללו שהקשר הסמנטי ביניהם לבין חוסר הגעה לפגישה ניראה מאוד קלוש?

התשובה הפשוטה היא לא. מדובר בסוג הביטויים שקשה מאוד לתארך ולהבין, במיוחד בשפות שפחות מוכרות לנו. למשל בעניין הדינמו הכושל ברוסית, האינפורמנטים ששאלתי הסבירו לי שפעם הדינמואים ברוסיה לא היו שווים כלום והיה אפשר להתניע אותם ואז לחכות במשך שעות ללא ברכה בעמלך. משם "דינמו" הפכה למילה שמתארת בחורה שלא נותנת, והשאר היסטוריה. או משהו. מי יודע. ולכן אומר בפשטות ששאלה כזו, לגבי הביטויים שמופיעים למעלה, גדולה עליי. אולי מגיבינו יוכלו לספקלץ.

[ת' לשחר, אריאל ודוד]

Read Full Post »

[פוסט אורח של ברק אוירבך, דוקטורנט בחוג ללשון העברית באוניברסיטת חיפה]

בפרסומת החדשה של חברת "עלית" למוצר הנצחי — ה"ופל" — מוצגת שאלה מעניינת. בפרסומת מתוארת ישיבת הנהלה בחברה, ובמהלכה מתעורר ויכוח בין מנכ"ל החברה לבין אחד הסובבים את השולחן, דמות מצוירת (ילדותית משהו), עקשנית ורווית נימוקים משכנעים. השאלה שסביבה מתנהל הדיון היא: האם הצורה הנכונה היא 'וָפְלִים' או 'בָּפְלוֹת'? הנימוק המרכזי של הדמות המצוירת היא "אומרים בָּפְלוֹת". הוא מביא דוגמות מתקופות שונות בחיים (טיול של תנועת הצופים, אימא שמתפרצת לחדר ברגע אינטימי בין המצויר לחברתו, מארב בצבא), כשבכל אחת מהסיטואציות המילה ששימשה לציון הממתק הייתה "בָּפְלוֹת".

אני לא רוצה לפתוח כאן את הדיון האידיאולוגי שעולה מן הפרסומת — האם התקינות הלשונית היא על העליונה (הטהרנות, כלומר יש לומר "וָפְלִים"), או שיש לנהוג עפ"י הקורה בפועל, בשפה הדבורה היומיומית (המתירנות, ובמקרה שלנו, יש לומר "בָּפְלוֹת"). מה שכן אנסה לעשות, הוא להסביר: איך בכלל הגענו לצורה "בָּפְלָה"? וכמובן, שאין זאת אלא על קצה המזלג בלבד.

בשפות שונות בעולם, המילה המקבילה (בין אם לממתק המדובר, חטיף דק ואפוי, ובין אם לגרסאות השונות של הוופל הבלגי) דומה מאוד לזו שחדרה לעברית. באנגלית ובאיטלקית: WAFER, בגרמנית: WAFFEL (וגם OBLATE), בהולנדית WAFEL ובפולנית כמו בהולנדית, אבל גם WAFELEK. נכון, דומה מאוד לעברית, אבל איך הגענו מכאן למילה "בָּפְלָה"?

בעברית, ההגה 'W' (שהוא הגה מקורב, כלומר בין עיצור לתנועה) הפך להגה 'V' (שהוא עיצור שפתי-שיני, היינו בעת הפקת הצליל, האוויר נחסם באמצעות מגע בין השיניים לשפתיים). משום מעתק זה, נוצר מפגש בין שני עיצורים שפתיים-שיניים (ה-'V' החדש וה-'F' הקיים), וביניהם תנועות. מבחינה פיסית, קשה (באופן יחסי) ההגייה של שני העיצורים השפתיים-שיניים הללו ברצף, ולכן לשם קלות הדיבור נעשה בידול: במקום שני עיצורים בעלי תכונות דומות (שרק הקוליות מבחינה ביניהם), הוחלף אחד העיצורים בעיצור, שהתכונות שלו דומות לעיצור המוחלף אך שונות מן העיצור שנותר: העיצור הקרוב ביותר לעיצור 'V' מבחינת הקוליות ומקום החיתוך הוא 'B', ולכן הוא בא במקומו.

הרהור קטן לגבי ה-ה"א בסופה של המילה: ניסיתי לחשוב מאיפה היא הגיעה, אבל לא לגמרי ברור לי. עם זאת, אבן-שושן (1980) מסביר את המושג "אפיפית" כך: תופין דק, כעין "ביסקויט" או "ופלה". כלומר כבר אצלו מדובר בסיומת ה"א, והוא בכלל לא מכיר בקיומו של ה"ופל". מעניין, לא?

ולקינוח, איך אפשר שלא לסיים עם בָּפְלָה, ועם קטע ממערכונם של הגששים המכונית המגויסת שנכתב ע"י נסים אלוני:

-"הגיע האוטו עם הבפלה? אז תביא בפלה"
-"אין בפלה"
-"אז תביא תפוזים עם בפלה!"
-"אבל אין בפלה!"
-"אז תביא אשכוליות עם בפלה!"
-"וולאק אין בפלה!"
-"טוב….אז תביא רק בפלה!"

עכשיו תנסו אתם להגיד את השורות האלה עם "ופל" או "ופלה"…

[היתה זו רשומת אורח של ברק אוירבך. תודה ברק! קבל מאיתנו אפיפית במתנה. רוצים לכתוב גם? צרו קשר דרך צרו קשר]
 

דוקטורנט בחוג ללשון העברית באוניברסיטת חיפה

Read Full Post »

[פוסט אורח מאת הדס יברכיהו, סטודנטית לבלשנות (מי היה מאמין?) באוניברסיטת תל אביב (מי היה מאמין?)]

באחת ההפסקות ביאט"ל 26 יצאנו מאולם בק לשאוף קצת אוויר, ונתקלנו בשני שלטים, אחד מעל השני – "ארכיב מנהל הסטודנטים" ו-"ארכיון כללי והיסטורי".

 

ארכיב קיבה

תצלום ארכיון ישן

 

ככל שהיה ידוע לנו, ל"ארכיב" ול"ארכיון" יש את אותה משמעות, אז למה החליטו בבר אילן להשתמש פעם בזו ופעם בזו? לא מדובר בטעות או מקריות כיוון שצמד השלטים חוזר בעוד מקומות ברחבי הקמפוס…

אז במסגרת "בלשנות חוקרת" חיפשתי קצת במילונים ובאינטרנט, והתוצאות רק חיזקו את מה שחשבנו – לפי אבן שושן, "מילה במילה", ויקימילון (ארכיון, ארכיב) ואתר השפה העברית, שתי המילים הן מילים נרדפות שחדרו לעברית בתקופות שונות – "ארכיון" חדרה דרך יוונית/לטינית בתקופת חז"ל, ו"ארכיב" חדרה בעת החדשה בהשפעת השפות האירופאיות. לא מצאתי דבר המראה שיש הבדל במשמעות בין השתיים. בדקתי גם בגוגל (שביאט"ל התברר שהוא כלי מחקר לכל דבר), וארכיון מחזיר כ- 385,000,000 תוצאות בעוד ארכיב מחזיר כ- 179,000 תוצאות, בעיקר אתרים של שירותי גניזה וארכיב.

אוקיי, אז שתי המילים זהות במשמעות וההבדל ביניהן הוא בזמן בו חדרו לעברית. אז למה יש שני שלטים?…

שלחתי מייל לאקדמיה ללשון העברית. ענו לי ששתי הצורות הן גלגול של המילה הלטינית archivum – "ארכיון" היא מתקופת לשון חז"ל ו"ארכיב" היא מהעת החדשה, יתכן בהשפעת הגיית המילה בלשונות אירופה (למשל בגרמנית), והוסיפו שהצורה "ארכיון" עדיפה ולמעשה אפשר לראות בה צורה עברית. אפילו קיבלתי ציטוט המשלב בין שתי הגרסאות – "אלא במה יש צורך? שישיר על גדולתה של פולין, שיחטט בארכיביונים עתיקים, בכדי להוציא משם עוד ראיה נוספת לתפארתה ורוממותה של פולין." (יוסף חיים ברנר, ספרות הפולנית בערב ימי המלחמה, עמ' 6).

התקשרתי גם לאוניברסיטת בר אילן ודיברתי עם מישהו מאותו "ארכיב". מסתבר ששני השלטים מובילים לאותו מקום – ארכיב הסטודנטים – שמרכז חומר מנהלתי של האוניברסיטה. גם מצאתי תיאור של המקום באתר של האוניברסיטה. כלומר, שם המדור – ארכיב מנהל הסטודנטים, ותפקידו – ארכיון כללי של האוניברסיטה.

והמסקנה הסופית המתבקשת – שלט אחד מורה על שם המדור, והשלט השני מסביר מהו המקום הזה. כל כך פשוט. זה מסתדר יפה עם כל תוצאות שירותי הגניזה והארכיב שמצאתי בגוגל – המילה החדשה יותר משמשת בעיקר לשמות של ארגונים שונים, בעוד הוותיקה מפרשת למה הכוונה…

 

התמונה המעפנה מהפלאפון של איתמרק

בסוף לא גנזנו את התמונה השנייה

 

[. היה זה פוסט אורח. רוצים גם אתם לפרסם פוסט אורח? דברו עמנו! נקבלכם בברכה]

Read Full Post »

בשולי הכתבה בטמקא על המחקר של רפיק אברהים וזוהר אביתר (ההדגשה שלי):

התברר כי רק ההמיספרה השמאלית הצליחה לזהות את זוגות האותיות בערבית. הדבר עולה בקנה אחד עם ממצאים קודמים של החוקרים לפיהם ההמיספרה הימנית מתקשה בזיהוי גירויים שההבחנה ביניהם היא על בסיס לוקאלי – כלומר, היא מזהה רק את תבנית האות הכללית ואינה רגישה לניו-אנסים מקומיים כמו סימני הניקוד.

ניו-אנס? זו כנראה אטימולוגיה עממית. מקור המילה nuance הוא בצרפתית וחוזר למילה nue, "ענן". התואר new באנגלית מודרנית הוא גלגול של המילה הפרוטו-גרמאנית *newjaz בעלת אותה המשמעות. למילה זו אחיות בשלל שפות הודו-אירופאיות (למשל novus בלטינית ו-neu בגרמנית).

Read Full Post »

היום בתוכנית: חידושים והמצאות! רצה הגורל ודווקא במהלך הימים הנוראים הייתי צריך לעבור על מחקרים שנעשו לאחרונה בבלשנות חישובית כדי לראות אם משהו קשור לפרוייקט שאני עובד עליו. בגלל שיום כיפור הוא זמן לחשבון נפש, החלטתי לספר בקצרה על כמה רעיונות יפים במיוחד שמומשו לאחרונה בצורה לא פחות יפה. סך הכל, גם כאן וגם באכסניות אחרות ירדנו מדי פעם על בלשנות חישובית והמרוץ אחר "שיפור של חצי אחוז בתוצאות", וחבל להתעלם מהעבודה הרצינית שנעשית שם על דברים שבאמת רלוונטים לבני אדם.
בתפריט: בלשנות חישובית בשירות הפרכת תיאוריות ספרותיות, תיעוד כל השפות בעולם, חלוקת מילה להברות ומציאת מידע בהסתמך על סמנטיקה תיאורטית.

  • מציאת רשתות חברתיות בסיפורת אנגלית של המאה ה-19 (כמובטח). אחד המאמרים האהובים בכנס ACL האחרון הוא של קת'לין מק'קיון ועמיתיה מאוניברסיטת קולומביה שבדקו תיאוריה ספרותית ומצאו שלא דובים ולא יער. בהסתמך על תיאוריה ספרותית של עיור ושל הקשרים בין הדמויות בעיר ובכפר, שמושפעת ישירות מהכרונוטופ של בכטין, מקובל לטעון (מקובל? לא יודע. יש אנשי-ספרות בקהל, אנא האירו את עיניי) שכשרומן מתרחש בכפר ישנם קשרים מועטים אך חזקים בין מספר קטן של דמויות; מנגד, ברומן עירוני ישנן הרבה דמויות אך קיימים מעט קשרים ביניהן.

    רשת חברתית לדוגמה מהמאמר של אלסון ואחרים (2010)

    טוב, נגיד שזו תיאוריה מבוססת. שתי השלכות שקשורות זו בזו ניתנות לבדיקה: הראשונה, שיש קשר הפוך בין כמות הדיאלוג ובין מספר הדמויות הפעילות בסיפור. השנייה, ש"הרשת החברתית" בין הדמויות תהיה מהודקת יותר אם העלילה מתרחשת בכפר (או באיזו אחוזה ציורית).
    את הרשת החברתית אפשר לדמות בעזרת רשת של דיאלוגים בין הדמויות וכך לתאר כך היכן הקשרים החזקים יותר, וכמובן שהיא נבנית אוטומטית לחלוטין בעזרת ניתוח אוטומטי של הטקסט והדיאלוגים, כך שאפשר לתאר בצורה די טובה את הקשרים בין הדמויות.
    ועכשיו השוס – לא דובים ולא יער. הקשרים בין הדמויות דומים למדי, לא משנה באיזה מרחב מדובר. מה שבאמת משפיע הוא נקודת המבט – האם יש לנו עסק עם דובר בגוף ראשון או בגוף שלישי.
    למה זה להיט: כי הנה דוגמה נהדרת לעיבוד ממוכן של טקסטים שמספק דרך אמינה להעריך תיאוריה ספרותית. אני הכי אוהב את הבלשנות החישובית שלי כשהיא רלוונטית לתחומים נוספים.
    למה זה לא יתפוס בחיים: כי כמו שאמר האל דאומה השלישי, למה התיאוריות האלה קיימות בכלל? כלום לא בדקו חוקרי הספרות יותר משלושה רומנים לפני שיצאו בהכרזות כאלה? אבל מעבר לזה, אני תוהה מה הסיכויים שחוקר ספרות יתייחס ברצינות למחקר כזה. הרי למען השם, יש שם גרפים ומספרים!

  • פרוייקט השפה האנושית: בונים קורפוס אוניברסלי של שפות העולם:
    סטיבן בירד, בלשן חישובי מדופלם, מודאג מזה תקופה מהיעלמות שפות בסכנת הכחדה. יחד עם סטיבן אבני הוא חשבו על רעיון כביר – קורפוס ענק, בעל מבנה מינימלי ואלגנטי, שיכיל כמות עצומה של חומר מכל שפות העולם. מעין מקבילה בלשנית לפרוייקט הגנום האנושי.
    המטרה היא לשמר את הידע הקיים ובו-בזמן לבנות תשתית להעמקתו. כאבן-בוחן ליכולת שלנו כבלשנים לטעון שהצלחנו "להבין" (ואולי עדיף "לתעד") שפה כמו שצריך משתמשים אבני ובירד באבן הרוזטה: אם אנחנו מצליחים לתרגם משפה נכחדת לאנגלית – או לשפה אחרת, שהרי הכל סובב סביב אנגלית בכל מקרה – סימן שהבנו אותה. לכן, הקורפוס מעוצב עם יישומים לתרגום מכונה כהישג נדרש.
    למה זה להיט: כי יש הרבה מאגרי מידע דומים (הפניות במאמר) אבל הם אינם מקיפים והמטרה שלהם לא מוגדרת מספיק. כי עם כמה שינויים, זה יוכל להיות שימושי מאוד גם עבור תיאורטיקנים ומתעדי שפות.
    למה זה לא יתפוס בחיים: כי זה לא כלי הכרחי עבור תיעוד שפה. כי רמת הדיוק בניתוח תהיה שטחית מדי עבור תיאורטיקנים. כי לבלשנים לא-חישוביים אין תמריץ של ממש לתרום מזמנם לפרוייקט הזה, וכי בלשנים חישוביים עשויים לחשוב שזה פרויקט יפה וראוי אבל עדיף שמישהו אחר יבזבז עליו את הזמן שלו, אני צריך עכשיו לסיים מאמר לקראת כנס ועוד לא הגעתי לשיפור של חצי אחוז.
  • על חלוקת פונמות להברות:
    חלוקת מילה להברות היא – אולי במפתיע – משימה לא טריוויאלית עבור פונולוגים ודוברים ילידים כאחד, בטח ובטח בשפה ממזרית כמו אנגלית (איך אומרים, des-troy? או אולי de-stroy?). קולין צ'רי ממיקרוסופט ושני קולגות שלו לקחו על עצמם לשפר את היכולות הקיימות בתחום.
    מה שיפה במאמר הזה הוא ההתבססות על תיאוריות פונולוגיות (עד שמסתבר שהן לא טובות מספיק, ואז משתמשים בלמידת מכונה במקומן). לראות דברים כמו Maximal Onset Principle והפניות למאמרים של פונולוגים במאמר בלשנות חישובית זה עניין מרענן כשלעצמו. אבל האם זה עוזר?
    החוקרים מימשו שלושה עקרונות פונולוגיים כדי לראות האם הם מצליחים לחלק מילים להברות כמו שצריך. בנוסף, הם בנו מערכת משלהם שמשתמשת בתכונות של הפונמה, ובעיקר אילו פונמות אחרות באו לפניה ואחריה, ולומדת באופן עצמאי על חשיבות התכונות הללו ממילים שמופיעות בטקסטים קיימים (לאנשי למידת המכונה שבינינו – הם השתמשו ביציר-הכלאיים הנהדר SVM-HMM). בסופו של עניין, המערכת שלהם עובדת יופי-טופי ומסוגלת לחלק מילים להברות בצורה מרשימה למדי.
    למה זה להיט: כי יש כאן פתרון חישובי לעניין שתיאורטיקנים מתקשים להסכים לגביו; וכי אפשר לראות שהרבה יותר קל לשחק עם משהו "טכני" כמו פונולוגיה מאשר עם משימות מסובכות ומופשטות יותר כמו אתגרים תחביריים וסמנטים.
    למה זה לא תופס: כי בסופו של דבר אנחנו נותרים עם תכונות שנקבעו שרירותית ומערכת למידת מכונה שלומדת מטקסט קיים, מה שיש תחת כל עץ רענן שעוסק בעיבוד שפה טבעית. וכי זה אמנם נחמד שאפשר לעשות את זה אבל זה לא מקדם את התאוריה: הייתי שמח לראות את סוג החוקים שהמערכת למדה ולעשות מהם לתיאוריה עצמאית, אבל אני חושד שהם מתבססים על זה שיש כמות פרמוטציות מוגבלת ל-22 26 אותיות באנגלית אז לא מאוד קשה ללמוד אותן ואת הסדר הפונמי המשתמע.
  • זיהוי צירופים שמניים גנריים:
    בסמנטיקה, ביטוי גנרי הוא ביטוי בסגנון "כלב הוא חיה בעלת ארבע רגלים". אבל מה לגבי כלב שהיה בתאונת דרכים, לא עלינו? האם אינו כלב יותר? ואם אנחנו אומרים ש"צרפתים אוכלים בשר סוס", מה לגבי הצרפתים הצמחונים? ואם אנחנו אומרים ש"עכברים מפריעים לבני האדם", האם זה באמת נכון? הרי הרוב המוחלט של עכברי העולם נסתר מאיתנו ולא נגלה לעינינו אף פעם.
    בסמינר לבלשנות חישובית באוניברסיטת היידלברג שיערו שמשפטים כאלה מכילים ידע רב על העולם ולכן כדאי למצוא דרך לזהות אותם באופן ממוכן. הם התרכזו לעת עתה בצירופים שמניים גנריים ("כלב הוא חיה בעלת ארבע רגליים") ולא במשפטים גנריים ("לפלוטו יש מרק ועצם").
    אחד הדברים הבעייתים בביטויים גנריים הוא שאין פתרון קסם: זה לא שמשפטים בהווה הם תמיד גנריים, וזה לא שמשפטים גנריים הם תמיד בהווה ("הם חיו באושר ועושר").

    כך נראית טבלת התוצאות של צמד בלשנים חישוביים גרמנים

    המערכת השתמשה בכשני תריסר תכונות של המשפט (האם הוא בהווה? האם שם העצם ביחיד או ברבים? ושאר תכונות סמנטיות ותחביריות) ואז עשתה חזרות מרובות עם צירופים שונים של תכונות כדי למצוא אילו הן החשובות ביותר. מהיכרות עם המחברים אני יודע שמדובר באנשים יסודיים למדי, ואכן הם מפרטים את כ-ל התוצאות שהמערכת שלהם השיגה בתצורותיה השונות. חלקן טובות, חלקן פחות, אם כי באופן כללי הם השיגו תוצאות מעודדות למדי, ונראה שבהחלט נעשה כאן צעד בכיוון הנכון.
    למה זה להיט: כי בדומה למאמר הקודם, יש כאן נסיון לתת פתרון חישובי למשהו שהתיאוריה הגיעה לסוג של קונצנזוס לגביו, אבל לא קונצנזוס שאפשר למכן עדיין באופן יעיל.
    למה זה לא תופס: כי בדומה למאמר הקודם, זה לא עוזר לתיאוריה בכלל. להגנתם ייאמר שזה לא אמור לעזור לתיאוריה – זה אמור לעזור ליכולת להפיק מידע מטקסט, ולפי הקריטריון הזה העבודה תישפט בהמשך הדרך.

אם ארבעת המחקרים האלה עשו לכם תיאבון, ודאי תשמחו לשמוע שבתוכניה של כנס EMNLP שייערך בחודש הבא כבר בולטים מספר מאמרים עם שמות מסקרנים. ביניהם ניתן למצוא את  "Poetic" Statistical Machine Translation: Rhyme and Meter מאת צוות תרגום המכונה של גוגל, את Modeling Organization in Student Essays ואת Improving Gender Classification of Blog Authors (לעשות מחקר כזה אצלנו זה קל; אנחנו עדיין מחכים לבלשנית שתרצה לתרום לנו).

David Elson, Nicholas Dames and Kathleen McKeown (2010). Extracting Social Networks from Literary Fiction. ACL 2010.
Nils Reiter and Anette Frank (2010). Identifying Generic Noun Phrases. ACL 2010.
Steven Abney and Steven Bird (2010). The Human Language Project: Building a Universal Corpus of the World’s Languages. ACL 2010.
Susan Bartlett, Grzegorz Kondrak and Colin Cherry (2009). On the Syllabification of Phonemes. NAACL 2009.

Read Full Post »

האם השפה משפיעה על המחשבה? סוף השבוע מפנק אותנו בשתי כתבות איכותיות בנושא והמסקנה היא: די כבר, למי אכפת.

טוב, אולי קצת אכפת. כשהתחלתי לכתוב על המחקרים בנושא לא חשבתי שתוך שנה הם יהפכו ללהיט של עולם המדע הפופולרי, אבל זה רק מראה עד כמה אני מנותק כאן במגדל השן שלי. על כל פנים, מי שקורא בצמא ובשקיקה את הרשומות שלנו בנושא ודאי ישמח לעיין בשני כתבות נוספות.

הכתבה הראשונה היא מאת איתי להט (שעושה עבודה יפה לאחרונה) בכלכליסט (ביידיש זה נשמע יותר טוב, 26/8/10). כותרת המשנה: "מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע". מלבד כמה אי-דיוקים מזעריים וכמה טענות מגוחכות לגבי יכולות מתמטיות של ילדים (שלמרבה המזל לא נבעו מלהט עצמו), מדובר בסקירה נאה ביותר.

הכתבה השנייה היא טור של לא אחר מאשר גיא דויטשר, שעיבד פרק מהספר החדש שלו עבור הניו יורק טיימס (Does Your Language Shape How You Think?, 26/8/10). הכתיבה של דויטשר קלילה ונינוחה כתמיד, והוא מצליח לתמצת יפה את הנושא בלי להיגרר להצהרות חסרות כיסוי על טבעה של השפה.

כאמור, מי שקורא על הנושא הזה אצלנו לא ימצא כאן הרבה דברים חדשים, ובכל זאת שתי אנקדוטות לא היו מוכרות לי קודם לכן: אחת היא מהטור של דויטשר ונוגעת לדובר גוגו ימיד'יר (שבט שמשתמש ברוחות השמיים כמו מזרח-מערב במקום בכיוונים כמו ימין-שמאל) אשר הגיע לכפר אחר ולא הצליח למצוא את הידיים והרגליים משום שמזרח ומערב כבר לא היו כל כך ברורים לו.
השנייה היא מהכתבה של להט, על שופטי כדורגל ששורקים (אולי) בהתאם לכיוון הקריאה והכתיבה שלהם.

אין לי עוד מה להגיד על הכתבות האלה, אבל זה יכול להיות מקום טוב לשוחח עליהן אם חם לכם מדי לצאת החוצה השבת.

מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע

Read Full Post »

« Newer Posts - Older Posts »