Feeds:
פוסטים
תגובות

Archive for אוגוסט, 2010

בטמקא דיווחו ביום רביעי (דרושים בארה"ב: מתרגמים מסלנג שחור לאנגלית):

הסוכנות הפדרלית למלחמה בסמים (DEA) פנתה לחברות תרגום בבקשה להעסיק תשעה עובדים המתמחים ב"אבּוֹנִיקְס", שם שהודבק לסלנג של אפרו-אמריקנים המערב את אוצר המילים האנגלי במבנה שפות אפריקניות.

מאמצי ארצות הברית למגר את הסחר בסמים נתקלו בקשיים בלתי צפויים. גם כשהם מצליחים להחדיר אמצעי הקלטה סודיים ולהאזין לעסקאות סמים – הם לא תמיד מבינים מה נאמר שם.

ואיך אפשר בלי:

גורמים שונים הביעו חשש כי המהלך ייתן לגיטימציה לשפה המבוססת למעשה על אנגלית קלוקלת. בתגובה, נחלצו בלשנים להגנת האבוניקס והבהירו כי השפה יכולה להיות מסובכת יותר ממה שנדמה.

אני לא מבין גדול באנגלית שחורה (וגם לא מבין קטן), אבל יש כמה נקודות מעניינות שקשורות לשפה הזו (וכשאני אומר דבר כזה, קוראינו הוותיקים כבר יודעים שבמהלך הרשומה אשעמם אותם עם דוגמאות תחביריות אבל בסוף אקנח עם סרטון יוטיוב).

AAVE

ראשית, ebonics הוא מונח לא-רשמי וקצת מיושן. בלשנים מכובדים, מכופתרים ומעונבים מעדיפים להשתמש בשם טכני כמו African American Vernacular English, AAVE, (אנגלית מדוברת אפריקנית-אמריקאנית) או Black Vernacular English, BVE. בכמה מקומות עוד קוראים לזה jive. כמו כל ניב של שפה טבעית, גם AAVE הוא מערכת יציבה בת חוקים רבים וסדורים ולא סתם כמה מילות סלנג זרוקות ביחד. הכתבה לא שוכחת לצטט בקצרה את פרופ' ג'ון ריקפורד, אחד מחוקרי AAVE הידועים בעולם, אבל אני לא בטוח שיש יסוד לסברה של המחבר לפיה AAVE מערבת "את אוצר המילים האנגלי במבנה שפות אפריקניות" (האם הם מתכוונים לערבית או לאפריקאנס? ניחא).

דקדוק

ניתן דוגמה קלאסית למבנה הדקדוקי המסודר של הניב. באנגלית מדוברת ישנו מבנה בשם wanna-contraction. המקור של המבנה הזה הוא ב-AAVE (אם אני לא טועה):

  • You want to go.
  • You wanna go.

עכשיו בואו נראה מה קורה אם משחקים עם זה קצת:

  • You want Eli Yishai to resign.
  • You want who to resign?!
  • Who do you want to resign?
  • *Who do you wanna resign?

הופה, מה קרה פה? ההסבר המקובל הוא שמילת השאלה who משאירה "עקבה" (trace) כשהיא עוברת לתחילת המשפט: Who do you want [him] to resign, ולכן המחרוזת want to לא יכולה להתמזג – יש משהו בלתי-נראה ובלתי נשמע באמצע! הנה נתנו הסבר תחבירי אלגנטי שמאיר חוקיות בדקדוק של הלהג ועל הדרך השתמשנו במבנים מופשטים מפחידים.

היבטים חברתיים

כמובן שאת מירב העניין מספקים ההיבטים הסוציובלשניים של AAVE. בהקשר הזה כדאי להזכיר, מלבד העבודות של ריקפורד, טור שכתב  ג'ון מקוורטר, חוקר AAVE וקריאוליסט, אחרי שהארי ריד (מנהיג הרוב הדמוקרטי בסנאט) אמר שלברק אובמה "אין מבטא כושי" ועורר סערה זוטא. הטור של מקוורטר נוגע בשלל עניינים שבתפר בין האוכלוסיה השחורה, האוכלוסיה הלבנה, השפה השחורה והשפה הסטנדרטית והוא מומלץ מאוד.

למעוניינים בדוגמה חיה אין מקור טוב יותר מאשר הסצינה האלמותית הבאה ב"טיסה נעימה" (תודה ליובל על התזכורת). בסרטון השני מעלה צוות ההפקה זכרונות יחד עם השחקנים שכתבו את הסצינה, ושימו לב שאפילו הם (שמופיעים בערך אחרי דקה) מתקשים להתייחס ל-AAVE (או jive) בתור יותר מקצת סלנג.

Read Full Post »

האם השפה משפיעה על המחשבה? סוף השבוע מפנק אותנו בשתי כתבות איכותיות בנושא והמסקנה היא: די כבר, למי אכפת.

טוב, אולי קצת אכפת. כשהתחלתי לכתוב על המחקרים בנושא לא חשבתי שתוך שנה הם יהפכו ללהיט של עולם המדע הפופולרי, אבל זה רק מראה עד כמה אני מנותק כאן במגדל השן שלי. על כל פנים, מי שקורא בצמא ובשקיקה את הרשומות שלנו בנושא ודאי ישמח לעיין בשני כתבות נוספות.

הכתבה הראשונה היא מאת איתי להט (שעושה עבודה יפה לאחרונה) בכלכליסט (ביידיש זה נשמע יותר טוב, 26/8/10). כותרת המשנה: "מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע". מלבד כמה אי-דיוקים מזעריים וכמה טענות מגוחכות לגבי יכולות מתמטיות של ילדים (שלמרבה המזל לא נבעו מלהט עצמו), מדובר בסקירה נאה ביותר.

הכתבה השנייה היא טור של לא אחר מאשר גיא דויטשר, שעיבד פרק מהספר החדש שלו עבור הניו יורק טיימס (Does Your Language Shape How You Think?, 26/8/10). הכתיבה של דויטשר קלילה ונינוחה כתמיד, והוא מצליח לתמצת יפה את הנושא בלי להיגרר להצהרות חסרות כיסוי על טבעה של השפה.

כאמור, מי שקורא על הנושא הזה אצלנו לא ימצא כאן הרבה דברים חדשים, ובכל זאת שתי אנקדוטות לא היו מוכרות לי קודם לכן: אחת היא מהטור של דויטשר ונוגעת לדובר גוגו ימיד'יר (שבט שמשתמש ברוחות השמיים כמו מזרח-מערב במקום בכיוונים כמו ימין-שמאל) אשר הגיע לכפר אחר ולא הצליח למצוא את הידיים והרגליים משום שמזרח ומערב כבר לא היו כל כך ברורים לו.
השנייה היא מהכתבה של להט, על שופטי כדורגל ששורקים (אולי) בהתאם לכיוון הקריאה והכתיבה שלהם.

אין לי עוד מה להגיד על הכתבות האלה, אבל זה יכול להיות מקום טוב לשוחח עליהן אם חם לכם מדי לצאת החוצה השבת.

מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע

Read Full Post »

[פוסט אורח מאת אדם מתן]

ויקיפדיה - לוגו

האם אפשר להגדיר את מידת הדמיון בין שפות, שלא דרך מחקר בלשני?

נחשוב לרגע על קרבה בין שפות (ותרבויות). אפשר להניח, למשל, ששפות שדובריהן שוכנים זה בקרבת זה, תהיינה קרובות יותר זו לזו מאשר שפות הנמצאות ביבשות שונות. הקשר הלשוני בין שפות שונות נחקר מזה מאות שנים; אותי עניין לחקור את הנושא מזווית אחרת, של קיום מונחים זהים בשתי השפות.

נגדיר את המרחק בין שפות כסבירות לכך שמונח שקיים באחת קיים גם בשניה. כך למשל, יש סיכוי טוב שהביטוי "חמסין" יהיה קיים גם בעברית וגם בערבית, אבל סיכוי נמוך לכך שהוא קיים גם בשפת הנאוואחו. זו גישה שמתעלמת לגמרי ממבנה המילה, מהתקופה בה המילה נכנסה לשפה וממספר הדוברים הילידים המכירים את המילה; השיטה חוקרת רק את כמות המונחים משותפים לשתי השפות, ואולי גם את איכותם ותפוצתם.

מכיוון שסריקה מילונית היא עסק מסובך מאוד, החלטתי לעשות לעצמי הנחה מסויימת ולהשתמש בערכים בויקיפדיה כמקור. כלומר, הקשר בין שתי שפות ייקבע לפי מספר הערכים המשותפים לשתיהן. אפשר, כמובן, להרחיב את הבדיקה הזו למשפחות של שפות, כלומר לנסות למצוא קבוצות של שפות שמאופיינות על ידי מילים משותפות. חשוב גם לציין שבבדיקה הזו יש לא מעט בעיות והטיות סטטיסטיות – אבל הנושא עדיין מעניין מספיק בשביל לבדוק אותו.

כדי לבדוק את העניין כתבתי סקריפט קטן בפייתון. הסקריפט לוקח בכל פעם ערך אקראי מויקיפדיה העברית, ושומר בטבלה את רשימת השפות בהן מופיע הערך, למשל:

http://he.wikipedia.org/wiki/תא_אפנדימלי

en, ar, de, es, fa, fr, it, ja, pl, ru, sk, sl, sv

כלומר, הערך "תא אפנדימלי" קיים גם באנגלית, ערבית, גרמנית, ספרדית, פרסית, צרפתית, איטלקית, יפנית, פולנית, רוסית, סלובקית, סלובנית ושוודית. לעומתו, הערך "כ"ו בכסלו" קיים רק בעברית וביידיש (כן, יש פרייער ענציקלאפעדיע גם ביידיש, עם יותר מ7,000 ערכים – עסק מעניין בפני עצמו).

נצא מנקודת הנחה שמספר השפות אליהן מתורגם הערך הופכי לחשיבותו. כלומר, הערך על התא האפנדימלי תורגם ל13 שפות ולכן מספק אישוש חלש לקשר בין השפות, ואילו "כו בכסל"ו" תורגם רק לשפה אחת, ומספק לנו אישוש חזק בהרבה על הקשר בין עברית ליידיש.

כדי לכמת את הקשר, נגדיר את המקדם של כל ערך בויקיפדיה להיות ריבוע מספר השפות אליו מתורגם הערך. המקדם של הערך על התא האפנדימלי הוא 169 (13 בריבוע), ואילו המקדם של "כו בכסלו" הוא 1 (1 בריבוע). עבור כל ערך שנדגם, כל אחת משפות התרגום קיבלה ניקוד ההופכי למקדם. כלומר, סלובנית, שוודית ושאר השפות שהערך על התא האפנדימלי תורגם אליהן קיבלו 1/1690.00592 נקודות כל אחת עבור הערך, ואילו יידיש קיבלה נקודה אחת עבור כ"ו בכסלו.

צברתי את הערכים עבור 4,003 ערכים אקראיים מהויקיפדיה העברית (שהם כ4% מהערכים) והרי התוצאות:

ro 6.238
fi 6.302
sv 8.027
ar 8.420
ja 10.426
cs 10.829
pt 10.914
nl 13.281
es 14.357
it 15.747
yi 19.878
pl 20.503
ru 22.485
fr 30.873
de 31.004
en 290.949
831.000

קצת פרשנות

את מספר הנקודות הרב ביותר קיבל ה"אין תרגום", כלומר ערכים שאינם קיימים בשפות אחרות. צריך להזהר מעט מהנתון הזה, משום שיכול מאוד להיות שהערכים קיימים בשפות אחרת אך אף ויקיפד לא יצר קישור ביניהן. בכל מקרה, הנתון הזה מעניין כי הוא יכול לאפיין את היחידאות, או הבידוד, של שפה מסויימת.

השפות הבאות בתור, לפי סדר ניקוד יורד, הן אנגלית (290.9), גרמנית (31.0), צרפתית (30.87), רוסית (22.49), פולנית (20.50), יידיש (19.88) ואיטלקית (15.74). מעניין לשים לב לכך שהשפות הנפוצות בויקיפדיה, לפי סדר יורד, הן אנגלית, גרמנית, צרפתית, פולנית, איטלקית, יפנית וספרדית. הנתון המעניין כאן הוא שתי השפות שמספר הערכים המשותפים להן ולעברית גדול בהרבה מהסבירות הסטטיסטית – יידיש ורוסית. וכאן נראה לי שהצלחנו לקלוע יפה.

רעיונות…

  • עוד הרצות: אני מחכה בכליון עיניים להרצה הבאה של הסקריפט – על היידיש (אני מצפה לד מיון לעברית ולגרמנית), על שפה סקנדינבית ועל שפה מזרח אירופית.
  • ללמוד על מנגנון הקישורים הבין-לשוניים בויקיפדיה. איך נוצרים קישורים בין שפות? האם מדובר בתהליך חצי אוטומטי, או ידני לחלוטין?
  • התאמה סטטיסטית: לעבוד על ניתוח סטטיסטי תקף יותר לנתונים.
  • העלאת התוצאות לרשת בצורה מסודרת, אולי דרך אפליקציה בגוגל.
  • ויזואליזציה, אולי באמצעות דיאגרמות ון.
  • תרבויות ושפות: האם ייתכן שלא מדובר בקרבה בין שפות, אלא גם בקרבה בין תרבויות? למשל, הקשר בין רוסית לעברית יכול לנובע מקיומה של קהילה גדולה הדוברת את שתי השפות, ומתרגמת ערכים. זו מחשבה שהופכת את הפרוייקט, בעיני, למעניין הרבה יותר.

אשמח לתגובות.

[פוסט אורח מאת אדם מתן, מפתח תוכנה במקצועו, וסקרן תמידי בזמנו הפנוי. בוגר (בקרוב) של לימודי מדעי המחשב ותכנית כללית למדעי הרוח באוניברסיטה העברית. הפוסט פורסם במקור בבלוגו "הבלוג הכחול"]

Read Full Post »

חוקר התרגום איגנסיו גרסיה מאוניברסיטת מערב סידני הוא מאמין גדול בתרגום מכונה, והוא החליט לבדוק האם מערכות תרגום אוטומטיות יכולות לסייע למתרגמים בשר-ודם. במחקר שהתפרסם לא מזמן הוא נתן למספר סטודנטים לעבוד על טקסטים באנגלית ולתרגם אותם לסינית. עבור חצי מהטקסטים השתמשו המתרגמים בתרגום אוטומטי של גוגל כבסיס, והתוצאות היו – אולי במפתיע – טובות.

המשתתפים קיבלו ארבעה טקסטים, שניים בנושאי משפט ושניים בנושאי רפואה (יותר ברמת ויקיפדיה מאשר ברמת כתב עת מקצועי, אם לשפוט מהדוגמאות במאמר), עם גיוון מתבקש בסדר הצגת הטקסטים בין המשתתפים השונים. לא הותר שימוש במילונים, מרשתות ועזרים דומים. בשני טקסטים הופיע תרגום המכונה של גוגל בתור הטקסט המתורגם, ואותו שינו המתרגמים; בטקסטים האחרים, טקסט היעד היה זהה בתחילת העבודה לטקסט המקור. גרסיה ביקש לבדוק שני דברים: האם יש הבדל באיכות, והאם יש הבדל במהירות.

לגבי המהירות, 15 מתוך 28 הנבדקים עבדו מהר יותר עם עזרה של תרגום מכונה, כלומר בקושי יותר מחצי. גם בין המשתתפים ובין עצמם היה קשה לזהות נטיות: רבים מהסטודנטים עבדו מהר יותר עם תרגום מכונה על טקסט אחד אבל לאט יותר על טקסט אחר; וכמעט כולם עבדו לאט יותר על המטלה הראשונה, לא משנה מה היתה (תחושה שוודאי מוכרת למתרגמים רבים).

בעניין האיכות אפשר כבר לזהות מגמה: מתוך 56 תרגומים, 33 תרגומים מתרגום מכונה נוקדו על ידי בוחנים חיצוניים כטובים יותר. ציונים ממוצעים (מתוך 50) לתרגומים היו 33.8 עבור התרגום הסטנדרטי ו-36.4 עבור תרגום עם בסיס של תרגום מכונה (הציונים נעו בגדול בין 30 ל-40). שבעה משתתפים ניפקו תוצר טוב יותר עם בסיס של תרגום מכונה ושניים סיפקו תוצר גרוע יותר.

המשתתפים בניסוי רואיינו בתחילתו ובסופו לגבי העדפותיהם, וניתן היה להתרשם שהם חשבו שתרגום המכונה הוא רעיון טוב, במיוחד לאחר שניתנה להם הזדמנות להשתמש בו. בין הערות הסיום שלו, גרסיה גם מעלה את האפשרות שלחלק מהסטודנטים עשוי להיות ניסיון קודם בעריכת תרגומי מכונה, "בניגוד להמלצות המרצים שלהם". הבה נצא במחול ונרקוד את תרגום המכונה.

Ignacio Garcia (2010). Is machine translation ready yet? Target 22:1, 7–21.

Read Full Post »

בואו נדבר עוד קצת על המאמר של ניק אוונס וסטיבן לוינסון. ישבתי וקראתי אותו: מאמר של שני בלשנים מוערכים, 23 תגובות, ותגובת-נגד של המחברים. לפני שניכנס בעובי הקורה מומלץ לקרוא את ההסבר הקצר על הגישה החומסקיאנית ו/או את הסקירה הראשונית שלי בנושא (וגם את הדיון המעניין בתגובות), אם איכשהו פספסתם. שם נזהרתי לא לדבר יותר מדי על המאמר עצמו אלא על כתבה שתיארה אותו. עכשיו אנסה לפרוט את הדיון לפרוטות, בשלושה חלקים עיקריים. אוונס ולוינסון לא מסכימים עם החומסקיאנים ואומרים כך:

  1. אין תופעות אוניברסליות בשפה.
  2. השיטה הגנרטיבית לא עובדת.
  3. צריך תכנית מחקר אחרת.

למען הסר ספק, זהו דיון עכשווי כבד-ראש בשאלה בסיסית מאוד שנוגעת לשפה האנושית: איך. לעזאזל. היא. מתפקדת.

תופעות אוניברסליות בשפה – יש או אין

בלב העניין עומדת טענה של אוונס ולוינסון (להלן או"ל) לפיה אין תופעות אוניברסליות בשפה טבעית, כלומר דברים שנכונים לגבי כל שפה באשר היא ומהווים "דקדוק אוניברסלי" (UG, universal grammar). לאורך השנים הושמעו סברות רבות לפיהן לכל שפה יש אבחנה בין שמות עצם לפעלים; רקורסיביות; חלוקה תחבירית לצירופים שונים (צירוף שמני, צירוף פעלי וכן הלאה, מה שמכונה בלעז constituents); ועוד ועוד. או"ל מסתכלים על מספר גדול של תופעות ואומרים: הבל הבלים הכל הבל. המגוון העצום של השפות הקיומות מוכיח שאין תופעות אוניברסליות, לדבריהם, והם נותנים רשימה של הפרכות.

יש שתי בעיות עם הטענה הזו. הראשונה היא שהם קצת טועים, כי הניתוח שלהם מוטעה. על כך בחלק הבא של הרשומה. הבעייה השנייה היא איך מגדירים תופעה אוניברסלית. למשל, היום ברור שלא לכל השפות יש מילה עבור המספר 3 וגם ברור שיש שפות שבהן אפשר לסמן את הזמן על שם העצם ולא רק על הפועל, שני דברים שפעם נחשבו לבלתי אפשריים. מנגד, כשחומסקיאנים מדברים על מאפיינים אוניברסליים של שפה, הכוונה היא בדרך כלל למבנה תחבירי מופשט יותר: בכל שפה יש נושא ונשוא; אם בשפה יש צורת זוגי, יש בה בהכרח גם צורת רבים; בעץ תחבירי כל ענף מתפצל לכל היותר לשני ענפים אחרים; ושאר עקרונות מופשטים יותר. הדקדוק הגנרטיבי מחפש לנתח את התופעות הללו ולתת להן תיאור פורמלי.

מתבקש לומר, אם כן, שאם אין תופעות אוניברסליות, אזי הנחת היסוד שעומדת בבסיס הגישה הגנרטיבית ואותו דקדוק אוניברסלי היא שגויה: אין מה לתאר את כל השפות באבחה אחת, כי כולן שונות זו מזו באופן מהותי.
איך ניתן לבדוק את זה? האמת שאם לא בצורה תיאורטית (כל השפות זהות בבסיסן המופשט, כי עובדה שילד יכול ללמוד את כולן) אז בצורה אמפירית: האם הדקדוק הגנרטיבי מתאר שפות היטב, או שהוא שיטה כושלת בת כושלת? או"ל מפקפקים בכוחו.

דקדוק גנרטיבי כשיטה מדעית

או"ל מציגים שורה של תופעות תחביריות ולשוניות ומנסים להראות שההסברים של הגישה הגנרטיבית פשוט לא מצליחים לתאר אותן כמו שצריך. הם טוענים שרקורסיה לא הכרחית באף רמה, למרות שרקורסיה נחשבת לאחת מאבני היסוד של הבלשנות החומסקיאנית: לא ברמת המשפט השלם (עם הדוגמה שהופרכה משפת שבט הפיראהא) ולא ברמת המילה הבודדת. הם מראים עוד איך צירופים תחביריים הם דרך אפשרית – אבל לא הכרחית – לסדר מילים במשפט, משום שסדר המילים והצירופים במשפט הוא לא משהו שעוזר לשומע להבין את הנאמר (עמ' 441). לכן, הנסיון הגנרטיבי להכניס כל שפה לסד הצירופים התחביריים נדון מבחינתם לכשלון.

התגובה של התחבירן רוברט פריידין מעניינת במיוחד: הוא טוען בפה מלא שנתונים משפות אחרות (קרי משפטים שבהם יש תופעות "מוזרות") לא יכולים להפריך תיאוריה אם הם אינם חלק מתיאורה אלטרנטיבית, משום שבתאוריה קיימת יש מספר רכיבים שמשתלבים זה בזה. זו הצהרה מעט מפתיעה, אבל נדמה לי שהנקודה שלו היא כזו: ברגע שאנחנו אומרים שיש מבנה תחבירי מופשט, אנחנו צריכים לתאר מספר גורמים ומכניזמים שעובדים בתוכו. תוצאה סופית של מערכת כזו – שוב, משפט בשפה טבעית – מושפעת מכל הגורמים והמגבלות הללו, ולכן היא עשויה להיראות כאילו היא סותרת גורם כלשהו נקודתית; אבל הסתכלות מעמיקה יותר תגלה שלא כך היא. אני לא יודע אם הייתי מנסח את הטיעון שלי בצורה דומה, אבל נראה לי שכאן חבוי חלק עיקרי במחלוקת: מבחינת או"ל הכל חייב להסתדר יפה על פני השטח, ואותו ההסבר חייב לתפוש לגבי כל המידע מכל השפות בהתייחס לכל גורם שאמור להיות קיים במערכת. מבחינת פריידין ואחרים, יש בעיה בתיאוריה רק אם המבנים והתהליכים שהיא מגדירה אינם מסוגלים להסביר את הצורה השטחית שמתקבלת בסוף כתוצאה מהשילוב ביניהם.

ניבויים

בן לי תהה בפניי – וכמוהו בלשנים, פסיכולוגים התפתחותיים ואנתרופולוגים, רק לא בפניי – האם זה לא קצת מגוחך שהתיאוריה נהיית יותר ויותר מופשטת עם כל "הפרכה" (למשל, שצירופים תחביריים אינם המנגנון העיקרי לסידור מילים במשפט [כביכול]). מבחינת הגנרטיביסטים זה דווקא טוב: ככל שמנסחים תהליכים מופשטים יותר שיוצרים מודל טוב יותר של מה שקורה במוח, התיאוריה הולכת ומשתפרת. עכשיו, תיאוריה טובה צריכה לסוגל לנבא תופעות. אז הנה ניבוי אחד: כל שפה שמבדילה בין צורת יחיד וצורת זוגי תבדיל בהכרח גם בין צורת זוגי לצורת רבים. ועוד אחד: ישנן שפות שבהן יש צורת משולש, אבל לא תהיה שפה שבה צורת מרובע.

אז אולי ננסה לנבא תופעות ולראות איך זה מסתדר עם שפות חדשות? הבעיה היא שאין באמת שפות "חדשות": בלשן מתאר שפה כלשהי, ואז בא תיאורטיקן ומראה איך היא משתלבת בתוכנית מחקר כזו או אחרת (גנרטיבית, פונקציונלית, לא משנה). השפות ה"חדשות" היחידות שבאמת צצות מאפס הן שפות סימנים, ולמרבה הצער חוקרי שפות סימנים עדיין לא הגיבו על המאמר. אבל תשמחו לשמוע שמזה כמה עשורים מקובל לנתח שפות סימנים בכלים הגנרטיבים המקובלים, ותנחשו מה – הן מתנהגות בדיוק כמו שפות דבורות, ללא צורך להוסיף אף רכיב מיוחד למערכת. שזה נחמד.

המתודולוגיה של או"ל

הניתוח של או"ל את מגרעות השיטה הגנרטיבית קיים בשני רבדים: ראשית, הם מנתחים מידע קיים, ושנית, הם מסיקים מסקנות לפי הניתוח שלהם. הבעיה היא שבלשנים רבים טענו שאו"ל שגו בניתוח הראשון, מה שהוביל לניתוח מוטעה לחלוטין ברובד השני: דיוויד פסצקי הנכבד נזף בהם על ציטוטים לא מדויקים ועל התעלמותם ממחקרים שגיבשו צורות מעניינות להסתכל על שפות "בעייתיות" כמו וורלפירי; אנדרו נווינס (ההוא מהשריקות) הסביר את תפישת עולמו הפונולוגית ותיקן מספר ציטוטים; פריידן הנדון לעיל הפנה את או"ל למאמרים מלפני 20 ו-30 שנה שמתייחסים להיבטים של היררכיה, נושא שאו"ל ביטלו כלאחר יד; מארק בייקר, לואיג'י ריצי ושאר שמות בעלי משקל ניסו להסביר איך המחקר שלהם דווקא משקף יפה מאוד את מה שקורה בשפות העולם ואיך או"ל מתעלמים מההישגים האלה במופגן.

כך לדוגמה, או"ל מתעכבים על העובדה שמילות שאלה באנגלית (Wh-questions) מופיעות בתחילת המשפט אבל בסינית הן מופיעות בסוף המשפט. מקובל לומר שמילת השאלה "זזה" לתחילת המשפט, מה שמפריע לאו"ל מאוד, משום שבסינית היא לא זזה, אלא אם מניחים שהיא רק זזה באופן מופשט. בין המגיבים, ריצי, פסצקי, וסמולנסקי ודופו טורחים לציין שישנן מגבלות מסוימות על מילות שאלה שחלות עבור שתי השפות. אחת המגבלות היא באמת מופשטת וגורסת שישנה סימטריה בין מילות השאלה באנגלית ובסינית; מילות שאלה באנגלית מופיעות היכן שמילות שאלה סיניות אינן יכולות להופיע, ולהיפך. בהתחשב בזה, ביקורת כמו זו של מייקל טומאסלו (ביקורת שטחית ומאכזבת מפי מדען מבריק) נראית מגוחכת: הוא טוען שלדקדוק הגנרטיבי אין יכולת להסביר את מילות השאלה בסינית. נו, באמת.

בתגובת-הנגד שלהם, או"ל מזכירים שחילזון לא מכיל את המבנה המופשט של הקונכיה בתוך המוח שלו. זה כנראה נכון, אבל זו לא הנקודה: אפשר לתאר איך מודל כזה נראה, ואו"ל לא יכעסו כשנאמר שקונכיה יכולה להיות בצורת ספירלה לוגריתמית אם זה המודל שמתאר אותה.
נחזור לשפה הנהדרת וורלפירי, שנחשבת "לגולת הכותרת של השפות בעלות סדר מילים חופשי" (פסצקי). כבר לפני שני עשורים תיאר קן הייל הנערץ איך הפועל חייב להופיע במקום השני במשפט, ומשם ניתן היה להסיק עוד כמה מגבלות תחביריות על השפה (שתוארו בעבודת דוקטורט של ג'סיקה לגאטה לפני כמה שנים). או"ל לא נותנים את וורלפירי כדוגמה, אלא את ג'יווארלי שעדיין לא הוסברה בצורה דומה. שני הצדדים צודקים בתת-הוויכוח הזה: מבחינת או"ל, הנה שפה עם תופעה שסותרת עקרונות אוניברסליים. מבחינת פסצקי, השפה פשוט עדיין לא נחקרה כראוי, וכשתיחקר כמו וורלפירי, ניתן יהיה להסביר אותה כמו שצריך. או"ל מסרבים לחכות.

אם כך, מה בעצם הגישה של או"ל? הם מתעקשים שהם כן מעוניינם בתיאוריה בריאה ובעלת הכללות, אבל רוצים לעשות זאת מתוך הסתכלות אבולוציונית-תרבותית.

האלטרנטיבה

אמרנו שמבחינת או"ל אין טעם לבנות מודל של איך השפה קיימת במוח שלנו. אז מה כן? הם אומרים שצריך להסתכל על הגורמים שהובילו ליצירת שפה אצלנו. ישנם גורמים פסיכולוגים, קוגניטיבים, פונקציונליים, התפתחותיים ותרבותיים שגורמים לכך שהשפות שלנו נראות כמו שהן (ולכך שרבות מהן נראות דומות). את הגורמים האלה הם מעוניינים לבודד: האם מגבלות חישוביות מסוימות גורמות לכך ששפות מסוימות אינן רקורסיביות? האם הרגלים תרבותיים גורמים לכך שאנחנו אוהבים לרוב שפות עם נושא ונשוא? בעיני או"ל, הגורמים קבועים עבור כל המין האנושי, אבל המגוון והשפות לא.

השוואה מעניינת עורכים או"ל בין שפה טבעית ובין יכולות אחרות שאנחנו לומדים; הרי אין טעם לומר שהיכולת לרכוב על אופניים או לנגן בפסנתר היא מוּלדת – מה שמולד הוא היכולת ללמוד איך לרכוב תודות לשימוש במספר יכולות בסיסיות אחרות (עמ' 443). בכל זאת נראה לי שצריך להיזהר עם השוואות כאלה, בין היתר משום שלא כולנו יכולים לנגן בפסנתר טוב באותה מידה, לא משנה כמה נתאמן, אבל לכולנו תהיה שליטה דומה (אם לא זהה) בשפה.

אפשרויות פסולות, אפשרויות קבילות

ומה לגבי טענות כמו אלה של הבלשנית מגי טלרמן, שמזכירה שאותם פתרונות מופיעים בשפות שונות לחלוטין (גם לטינית וגם קלקטונגו משתמשים במערכות יחסות; גם באסקיית וגם שפות כמו דירבאל משתמשים בהפרדת ארגטיב-אבסולוטיב)? במידה רבה, זה שוב הצד השני של המטבע האו"לי, וניתן לראות בזה טיעון לכאן או לכאן.

דברים דומים אומרים האדונים המנוסים סטיבן פינקר וריי ג'קנדוף, תומכי UG מושבעים. בתגובתם הם מציגים כמה שפות תיאורטיות ומנחשים שאף פעם לא תהיה שפה כזו: שפה שבה כל המילים בנות הברה אחת, שפה שכולה תחשיב פרדיקטים, שפה שכולה תווים מוזיקליים וכן הלאה. הם גורסים שמשהו חייב להגביל את מרחב האפשרויות הקבילות, ומשערים שאם המגבלות האלה יוגדרו בצורה מפורשת, מה שיתקבל יהיה מאוד UG-י. או"ל עונים (1) שלשפות לא היה הרבה זמן להפוך למגוונות מאוד, (2) שהמגבלות הללו נובעות, כאמור, ממגבלות קוגניטיביות או פונקציונליות (3) ושבכמה שפות דווקא ישנם מאפיינים דומים, למשל השימוש של יאו ומאסאי בטון כדי להביע יחסים תחביריים.

מעניין לראות שהאנתרופולוגים, הפסיכולוגים ושאר הלא-בלשנים שהגיבו על המאמר תומכים באו"ל. נראה לי שיש שתי סיבות: הראשונה היא שהגישה של או"ל מאוד קוסמת לפסיכולוגים אבולוציוניים משום שהיא עצמה גישה אבולוציונית – מהם המרכיבים הבסיסיים (הקוגניטיביים והתרבותיים) שהולידו את השפה? הסיבה השנייה היא שהמודלים הבלשניים הקיימים הם באמת מופשטים ומסובכים, ולא בהכרח יהיו נהירים למי שבא מחוץ לתחום. אני בספק אם זה צריך לפטור חוקרים שבאים מדיסיפלינות אחרות מלנסות ולהבין אותם.

סיכום

הדיון שאו"ל מנסים לעורר נסוב על שאלה עיקרית אחת: האם יש מאפיינים אוניברסליים לשפה טבעית. הם טוענים שלא, ושהמגוון העצום של תופעות לשוניות ושל שפות הוא מה שצריך להנחות את חקר השפה. הזרם הגנרטיבי טוען שכן, ושהמבנה הבסיסי של כל השפות הוא זהה ואותו יש לחקור. כפועל יוצא של הנחת היסוד, שתי הגישות מסמנות תוכניות פעולה שונות: או"ל רוצים לראות מה הגורמים שמשפיעים על היווצרות שפה והם מזכירים מגבלות קוגניטיביות/חישוביות, התפתחות אבולוציונית, השפעות תרבותיות ומטען גנטי; הזרם הגנרטיבי לא מתעניין באופן מפורש באיך הגענו לכאן ובמקום זה הוא מנסה לבנות מודל של השפה הקיימת.

חלק גדול מהדיון הזה חשוב ומועיל, וחלק גדול עוד יותר הוא עקר. הרי מינימליזם, LFG, אופטימליות, טיפולוגיה, בלשנות השוואתית – כולן מתודות חקר בלשני שונות, אבל כולן בסופו של דבר עיוורים שממששים את הפיל במקומות שונים. אני במקרה חושב שלמינימליזם החומסקיאני יש ידיים גדולות יותר, אבל אין טעם לשלול את עצם קיומו של אופן הסתכלות אחר כל עוד הוא יוצר מסגרת עקבית ומסוגל לנבא בהצלחה תופעות נוספות. שווה להזכיר פעם נוספת שהמקום היחיד בו באמת אפשר לראות שפות חדשות נוצרות מאפס הוא אצל שפות סימנים, והתרומה של חוקרי שפות לא-דבורות לדיון הזה עשויה להיות חשובה מאוד.

אם לסכם את מחשבותי המשוחדות בנושא: דקדוק גנרטיבי עובד מצוין וההכללות שלו שרירות וקיימות, למרות הנסיונות של אוונס ולוינסון להפריך אותן. ישנו אוסף של תכונות שמאפשר לנו לרכוש שפה, שפה שמוגדרת על ידי מגבלות שונות. האם אפשר לקרוא לזה בשם כמו "איבר שפה", "אינסטינקט שפה" או "חוש לשפה"? ניחא. למה לא. אין לנו אוסף תכונות או "אינסטינקט" לתעופה (בניגוד לציפורים), אין לנו אינסטינקט לשימוש בחדק (בניגוד לפילים), ואין לנו אינסטינקט שמאפשר לנו למצוא את הדרך חזרה לכוורת ולהביע את המסלול הזה באמצעות ריקוד (בניגוד לדבורים). אבל יש לנו אוסף תכונות שמאפשר לנו לתקשר באמצעות שפה.

ודאי תשמחו לשמוע שגליון שלם של כתב העת Lingua יוקדש למאמרי-המשך. איזה כיף! בינתיים ניסיתי לתאר כאן את עיקרי השיח, ולא לסקור את המאמר כולו על שלל הצהרותיו תגובותיו. אם יש שאלות נוספות, זה המקום לשאול. ואם קראתם את כל הרשומה, מגיע לכם בונוס אוניברסלי:

Nicholas Evans and Stephen C. Levinson (2009). The myth of language universals: Language diversity and its importance for cognitive science. Behavioral and Brain Sciences 32:429–492. doi:10.1017/S0140525X0999094X

Read Full Post »

ויינט פרסמו ביום שני, סמוך לשעה השמחה של הבוקר, כתבה עם כותרת בזו הלשון (צילומסך למטה, כשתגיעו תבינו למה החבאתי):

עו"ד הנידונה למוות באיראן ברח לנורבגיה

לפני שנחליט אם ללמד את העו"ד קודם בוקמול או נונורסק, צריך להחליט מה לעזאזל הולך פה. רובנו, ואני מניח שגם רובכם, הרגשנו מועקה קלה בעיבוד המשפט הזה, שנראה כאילו מתחיל בנושא נקבה ועובר לדבר עליה בנשוא זכרי. למי שלא חש כאן את המועקה, נסביר שהקרי הראשוני שעלה לרובנו הוא: יש עורכת-דין, דנו אותה למוות באיראן, ועכשיו היא בורח (?!?) לנורבגיה. מי התייר האנגלו-סקסי שכתב את זה?

אז לא. דודי כהן (לפי הכתבה עם הכותרת המתוקנת, כאן), או העורכים שלו, התכוונו למבנה סמיכות: עורך-הדין של הנידונה-למוות-באיראן הוא הבורח. ואני מתמוגג כאן מכל רגע, כי כל כמה שניות עולה לי עוד דו-משמעות מורפולוגית/תחבירית שגרמה לרובנו לא להבין את הכותרת בקריאה ראשונה. הבה ניתן בהן סימנים.

  1. עו"ד הינה צורה שאינה מסומנת כזכר או נקבה, כלומר יכולה להיות שניהם. יודרשת התכוונו לעורך-דין, אנחנו פירשנו כעורכת-דין (בגלל הפועל הסמוך נידונה).
  2. קֶשר הסמיכות שבין המילה הראשונה לשנייה אבד אצלנו, ופורש כרווח שבין שם-עצם ופסוקית זיקה המתייחסת אליו.
  3. ה-ה שבראש המילה הנידונה משמשת כה"א הידיעה בקרי המקורי, ואצלנו פורשה כהתחלה של פסוקית זיקה (מה שיכול להחליף את ש- בפעלי בינוני).
  4. באיראן משמשת במקור כלוואי (שממשיך לתאר את הנידונה למוות), ואצלנו פורשה כתיאור מקום (של דין המוות).

שתי דרכים להפיג את העמימות נוסף על הדרך המתחכמת בה נקטו העורכים, שביטלה את דו-משמעות (1): לטפל ב-(2) ע"י פירוק הסמיכות (עוה"ד של הנידונה למוות באיראן), מה שמקל על הקריאה מיידית אבל ארוך במילה; או לטפל ב-(4) ע"י החלפה בשם-תואר (עו"ד הנידונה למוות האיראנית), מה שעדיין עושה קצת חלושעס, אבל כבר במילה הרביעית.

עוד כדאי לציין, שאלו מאיתנו שהבינו ישר את הכוונה המקורית הודו (תחת עינויי מלקות) שההקשר עזר להם מאוד. סיפורה של הנידונה למוות הספציפית הזאת פורסם בהרחבה בחודש האחרון. עוד עוד (עו"ד) כדאי לציין, שלו היתה העו"ד נקבה, כלומר בכותרת היה מופיע "ברחה" במקום "ברח", כנראה לא היינו יודעים עד שלב מאוחר למדי בקריאת הכתבה עצמה מה באמת קרה.

הרי לנו, אם כן, על פי הפרוגרמה החדשה (יותר נכון, המתוקנת), משפט-שאינו-חולצה (Garden Path) כהלכתו. המשיכו לשלוח מרכולתכם, ואל תשכחו לצלמסך!

(הינד כובע לאבנר קשתן, צלם המסכים המדופלם)

עו"ד הנידונה למוות באיראן ברח לנורבגיה

Read Full Post »

תקציר: 1) משפטי חולצה הם לא משפטי חולצה. 2) אנחנו צריכים שם חדש למה שעד עכשיו נקרא "משפטי חולצה". 3) אנחנו בהטוויטר! לא צריך להירשם או לעשות שום דבר מיוחד, רק ללחוץ על הקישור: dageshkal@.

פעם סיפרתי על "משפטי חולצה". זה נהיה להיט קטן, אבל יש בעיה אחת שמפריעה יותר ויותר לחברי המערכת כאן: קצת פישלתי בהגדרה. אמרתי שמשפט חולצה הוא garden path sentence, משפטים שנראים בסדר גמור אבל שדו משמעות לקסיקלית מפילה אותם בסוף, יוצרת כשל תחבירי קטסטרופי וגורמת לנו לקרוא אותם מהתחלה:

  • The horse raced past the barn fell
  • The Russian women loved died
  • Fat people eat accumulates (ת' ליואב)
  • כשיהודים בונים בניינים נופלים (ת' לבן לי)

תע"ג הגדירה זאת כך: "כשמגיעים למילה האחרונה כל המשפט קורס". אלה משפטי garden path, ואנחנו צריכים שם טוב עבורים. כאן ההזדמנות שלכם להציע שם מוצלח בתגובות או לצייץ אותן לעברנו ב-dageshkal@.

עד כאן הכל טוב ויפה, אבל אם אלה לא משפטי חולצה, מה כן?
אה, אז זהו. הגורואים שלנו משתמשים במונח Crash Blossoms עבור כותרות קצרות באמצעי התקשורת שבהן אחת המילים דו-משמעית ומכשילה קריאה נורמלית של המשפט (לפעמים אפשר לקרוא את המשפט בכל זאת והוא עדיין יהיה תקין, ולפעמים לא). האם באמת יש צורך בהפרדה בין שני הסוגים האלה? לא יודע. משפט Crash Blossom אפילו מוגדר כמקרה פרטי של Garden Path. אבל כמו שאמרתי כמה פעמים כשדיברנו על המינוח:

באמת התחוור לי מוקדם יחסית שאכן יצרתי מפלצת!
עושה רושם שהקוראים שלי זורקים את כל סוגי ההומונימיה וה-GP לתוך קלחת אחת כי לא טרחתי להפריד ביניהם. מצד אחד, זה קצת חבל. מצד שני, אנשים פתאום חושבים על דקויות תחביריות ודנים בשאלה האם משפט מסוים הוא משפט חולצה או לא ואיזו מין דו-משמעות טמונה בו. אז למרות הקנאות שלי למינוח נכון, קשה לי להיות מתוסכל מזה.

וכשמיכאל ז. התלונן ש-"בקיצור, חבל על המאמצים שלי. לא מבין אף אחת מהדוגמאות", עניתי באופן דומה:

מיכאל, אין צורך לשקוע במרה שחורה (הגם שלבלוג שלנו השפעה מכרעת על מצב הרוח). בסופו של דבר, תת-החלוקה לסוגים שונים של דו-משמעות היא כלי עבודה של העוסקים בתחום, ואך טבעי הוא שמינוח כזה או אחר יהיה מבלבל מדי עבור מי שלא מעורה בעניינים.
אולי בפוסט עתידי אנסה להבהיר את הדברים, ואולי לא. לא קריטי.

אז זה הפוסט העתידי. משפט חולצה הוא, אם לדייק, כותרת קצרה ודו-משמעית שכזו. דו-המשמעות הנוצרת היא תחבירית, אך מקורה לקסיקלי (כפל קטגוריות של מילה מסוימת). גם כזו היתה לנו כאן: גנב רכב נמלט והרג אופנוען. מיד נספר לכם על עוד אחת, אבל קודם עִזרו לנו להפריד בין שני הסוגים. כלומר, הַציעו שם למקרים התחביריים הקשים, אלה בהם אין קריאה נוספת למשפט כולו וצריך בשלב מסויים לקרוא הכל מהתחלה (כמו "כשיהודים בונים בניינים נופלים").

[ת' לסמנטיקאי הבית על שלל הערות והתעקשויות]

Read Full Post »

ארגון כלשהו בשם "הפורום למען ארץ ישראל" פצח בקמפיין מוזר כנגד הקרן החדשה ומאבקה למען העלאת תמלוגי המדינה מקידוח הגז. הסיבה שאני מכנה את הקמפיין "מוזר" אינה כרוכה במסריו המשונים, אלא במשהו מהותי הרבה יותר.

אחד מהנפוצים שבז'אנרי בדיחות האינטרנט הוא תצלום של שלטים בסינית ולידם תרגומם המגוחך, לרוב לאנגלית, תרגום שנובע משימוש בלתי מושכל בתוכנות תרגום. הסינים, אם כן, לא לבד:

גז ישראלי, גז ערבי. בקרוב: פיזיקה יהודית

הביטו-נא במודעת הקמפיין הזאת. הבעייה הכי גדולה בה, כמובן, היא שהטקסט בערבית, שתופס חצי משטחה, פשוט לא אומר כלום. אני מנסה לחשוב כיצד להסביר זאת, כי גבב המילים שמופיע כאן מאוד רחוק ממבע דקדוקי בערבית. המילה הראשונה היא "قريبا", שמשמעותה "בקרוב". מכאן מתחילה הנפילה. המילה השנייה היא سوف, מילית שמופיע לפני פועל בצורת הבלתי-מושלם כדי לציין שהזמן שלו הוא עתיד. הבעייה היא שכאן אין לאחריו פועל, אלא שם עצם מיודע: الفيضانات, שפירושו "השטפונות". ומיד לאחריו שם עצם מיודע נוסף: "الغاز", שפירושו "הגז". הצירוף השמני الفيضانات الغاز, ראוי לציין, גם אינו תקין בפני עצמו.

אז מה היה לנו כאן? לא יודע. אפילו אין באפשרותי להציע הצעת תרגום לדבר הזה. כשמעצב הפוסטר הוסיף "מישהו רוצה שלא תבינו", הוא כנראה התכוון אל עצמו: כתיבה בערבית משובשת אכן מציבה מכשול כבד בדרך להבנה של המסר. לו לפחות היה להם את היושר להקטין קצת את הטקסט בערבית, אולי היה קשה יותר לשים לב.

אבל השאלה המעניינת באמת, כמובן, היא מה היה אמור להיות כתוב שם. הניחוש המושכל הוא שמישהו הלך והזין משהו לגוגל-תרגום, והעתיק את מה שהתקבל מבלי לבדוק. העובדה שהמשפט מכיל את המילה "גז", שקשורה לנושא הנידון, גם היא מרמזת בכיוון הזה. אבל כל הנסיונות שעשיתי לנחש משפטים שעשויים להיות המקור לתרגום המוזר הזה, ולנסות להזין אותם לגוגל תרגום כך שיתקבל הצירוף הנ"ל, עלו בתוהו. המילה "שטפונות" והמילית سوف מאתגרות במיוחד, ולכן אין לי ברירה אלא להשאיר את פענוח התעלומה לקהל הקוראים. אל-נא תקלו בה ראש. מדובר במשימה מורכבת שמחייבת ידע בעברית וערבית, יצירתיות ונחישות. אני מודה בהכנעה שלא עמדתי בה.

המסרים הבלתי-תקינים בערבית מככבים גם במודעות האחרות של הקמפיין:

תודה להקרן החדשה

תודה להקרן החדשה

המודעה אומרת, בערבית ובסרקאזם, תודה לקרן החדשה. את המשפט הזה, עושה רושם, כתב מישהו שיודע דבר או שניים בערבית, והלך ובדק באתר של הקרן החדשה ששמה בערבית הוא "الصندوق الجديد". רק שאז במודעה נשמטה לו האות و במילה הראשונה, ובנוסף, באופן שמזכיר בצורה מצחיקה למדי את חיבתנו ארוכת הימים לצורות יידוע ארכאיות בעברית, הוא שכח שכאשר שם עצם מיודע מופיע לאחר מילית היחס ل, האות ا של ال הידיעה נשמטת, ולכן המילה האמצעית היתה צריכה להיות للصندوق.

אבל שטויות. מה אני מציק. אולי זה בכלל סאטירה, כמו של אטימולוגיה עממית.

Read Full Post »

שם הבירה פאולנר נהגה בארץ כמעט תמיד עם טעם על ההברה הראשונה. לא כל כך ברור למה, ובכל מקרה במקור הטעם על ההברה השנייה. עכשיו, אני בחור ליברלי, תבטאו את זה איך שבא לכם. אבל באמא שלכם, אל תתקנו אותי כשאני מנסה לצאת קוסמופוליטי בעיני שותפי לבילוי.

אותו דבר בנוגע לגבינה שמפזרים על פסטה. כשהייתי ילד, היה לה רק שם אחד, פרמזן, כפי שנהוג לקרוא לה בצרפת, גרמניה, רוסיה ועוד. בשנים האחרונות התפשטה במסעדות המעודכנות יותר ההגייה "פרמז'אן", מין פשרה משונה בין השם הישן לשם האיטלקי, פרמיג'אנו רג'אנו, שמבוסס על שמות הערים פארמה ורג'ו. אז בסדר, אני מבין שזה מביא לכם הון סימבולי וכל זה להשתמש בהגייה האקזוטית יותר, שכוללת עיצורים מתוחכמים כמו ז' (שאגב אין באיטלקית), אבל בבקשה תניחו לי להגיד את זה כמו שאמא לימדה אותי.

אלה היו שתי חוויות קשות שעברתי בשבוע האחרון. חוץ מזה, אני גם מודאג מההידרדרות במצב הדמוקרטיה במדינה. אם זה ממשיך ככה, אני עוזב את הארץ.

Read Full Post »

במוסף "כלכליסט" האחרון כתב איתי להט על נושא פופולרי למדי: עד כמה הקידמה וריבוי המידע הופכים אותנו לטיפשים (דיגיטמבלים? מה באמת עושה הטכנולוגיה למוח האנושי, 5/8/10). אנחנו נגענו בנושא הזה בעקיפין כאן. לא נתייחס לכתבה כולה (היא שווה קריאה), רק נעיר לגבי עניין אחד:

… לפי מחקרים פורצי דרך שפורסמו בשנות ה־90, מספר המילים שהורים אומרים לילדיהם הפעוטים משפיע ישירות על התפתחות כישורי השפה והאינטליגנציה של הילד. ניסויים וסקרים ממושכים הניבו המלצות מעשיות להשמיע לתינוקות וילדים לפחות 2,000 מילים בשעה כדי להבטיח התפתחות תקינה ומהירה של אוצר המילים שלהם והבטחת תשתית ליכולתם ללמוד לקרוא מהר – והורים ששקועים במחשב או בבלקברי מאטים את התפתחות השפה של ילדיהם.

עד שלשום לא ידעתי שקיים קשר בין כמות המילים שילדים שומעים ובין האינטיליגנציה שלהם. בגלל שלא מצאתי דרך ליצור קשר עם להט, כתבתי תגובה באתר ("טוקבק", בלשון הדיגיטמבלים) ובה ביקשתי מראי מקום למחקרים פורצי הדרך הללו. התגובה שלי עדיין לא אושרה, אבל אני בטוח שיענו לשאלתי ברגע שתאושר. בינתיים, חיפשתי ונדמה לי שמצאתי.

את תקציר העניינים אפשר למצוא בטור קצר של הבלשן ג'ף נונברג. המחקר המדובר נערך לפני כמה עשורים ע"י בטי הארט וטוד ריזלי, שבדקו איך כמה משפחות בקנזס מדברות עם ילדיהן. מתוך 42 משפחות שנבדקו לאורך שנתיים וחצי, 13 היו ממעמד סוציואקונומי גבוה, 23 מבינוני-נמוך ו-6 נפלו תחת ההגדרה הנאה "welfare" (דהיינו, מובטלים). בקיצור נמרץ, החוקרים גילו שככל שההורים באו ממעמד גבוה יותר, כך הם דיברו יותר עם הילדים, נתנו להם יותר חיזוקים חיוביים, השתמשו באוצר מילים רחב יותר והשתמשו בכמות מילים גדולה יותר בשיחות עם ילדיהם. אוצר המילים של הילדים דמה לזה של הוריהם כבר בגיל 3, ומספר שנים מאוחר יותר הראו מבחני אוצר מילים שהפער בין הילדים שבאו ממשפחות עניות יותר ובין אלו שבאו ממשפחות עשירות יותר רק התרחב. עד כאן העובדות.

ישנן מספר דרכים לפרש את הממצאים האלה. להט החליט שאם אך פולטים 2000 מילה בשעה על הילד, ההתפתחות שלו תהיה תקנית והוא יוכל לקרוא מהר. זו לא מסקנה מפורשת של המחקר, אבל זה יכול להיות נכון. מאידך, בואו לא נשכח שבלי קשר לאינטיליגנציה שלי, לילדים שלי יהיו יכולות קוגניטיביות דומות: ילדים להורים אינטיליגנטים יותר יהיו ככל הנראה אינטיליגנטים יותר, ולו רק כתוצאה מהגנים. הורים שטורחים לדבר יותר עם הילדים שלהם כנראה גם משקיעים יותר בחינוך של הילדים שלהם באופן כללי. אין כאן סתירה חד-משמעית של הנאמר בכתבה, אבל מספר הקסם 2000 נראה לי חסר ביסוס. האם שיחות מרובות עם ילדיכם יגדילו את אוצר המילים שלהם? נו, יתכן. אולי מי מקוראינו יוכל להאיר את עיניי ולהצביע על ממצאים ממחקרים נוספים.

דרך אגב, אין לנו שום דבר עקרוני נגד "כלכליסט", למרות שרושם כזה עשוי להתקבל מפוסטים קודמים שלנו. בינתיים, בעוד "כלכליסט" שוקלים אם להעלות את התגובה שלי לכתבה של להט, נזכיר שאיתנו דווקא אפשר ליצור קשר בקלות באמצעות עמוד "צרו קשר", ושאנחנו קוראים את כל התגובות שנכתבות כאן. הן לא חייבות להיות בנות 2000 מילה.

Betty Hart and Todd Risley (1995). Meaningful Differences in the Everyday Experience of Young American Children. Brookes, 304pp.
Betty Hart and Todd Risley (2003). The Early Catastrophe: The 30 Million Word Gap by Age 3. American Educator 27(1).

Read Full Post »

עוד משהו מבית היוצר של לרה בורודיצקי: טור בוול סטריט ג'ורנל בו היא פונה לקהל הרחב ומספרת על המחקר שלה ושל קולגות. למרבה הצער, אין זכר לתחפושת הבננה הפעם, אבל רוב הדברים שם יהיו מוכרים למי שעוקב אחרי מעלליה אצלנו. יש גם מספר עניינים נוספים, שלגבי אחד מהם היא טועה (לעניות דעתי הקובעת, כמו שהיינו אומרים בצבא).

בין המחקרים המעניינים שעוד לא הזכרנו נמצא ניסוי שבו אותר הבדל בין איך שדוברי אנגלית, ספרדית ויפנית מתייחסים לגורם של אירועים כמו אגרטל שבור, בלון מפוצץ וכן הלאה. בעברית אפשר להגיד "האיש שבר את הכוס" או "הכוס נשברה", אם רואים סצינה שבה דבר כזה קורה. באנגלית יש העדפה לכיוון הגירסה שכוללת את עושה הפעולה, אפילו אם זה לא היה בכוונה. בספרדית יעדיפו את גרסת "נשברה" על פני גרסת "שבר". ובאמת, דוברי האנגלית שצפו במספר סצינות זכרו טוב יותר מי ביצע את הפעולה.

דבר דומה קרה עם תיאורים של "תקלת המלתחה" של ג'סטין טימברלייק וג'אנט ג'קסון שהוצגו למספר נבדקים (חפשו ביוטיוב אם אתם לא מכירים, אבל זהירות: פטמה!). במספר דיווחים קראו המשתתפים בניסוי על שמלה שנקרעה, בעוד קבוצה אחרת קראה על שמלה שטימברלייק קרע. אלה שקראו את הדיווחים בהם הדגש היה על מבצע הפעולה נטו להאשים את טימברלייק יותר בתקרית.

סך הכל נראה שאפשר להסכים על כך שהשפה משפיעה במידה כזו או אחרת על תפישת המציאות. הדברים משתבשים כשבורודיצקי טוענת שמחקר כזה סותר טענה חומסקיאנית קלאסית:

Dr. Chomsky proposed that there is a universal grammar for all human languages—essentially, that languages don't really differ from one another in significant ways. And because languages didn't differ from one another, the theory went, it made no sense to ask whether linguistic differences led to differences in thinking.

בין אם בורודיצקי מסכימה עם אוונס ולוינסון ובין אם לא, אני לא חושב שיש קשר של ממש בין שני הדברים. כן, התפישה היא שהבסיס המבני של כל השפות הוא זהה, מהבחינה הזו שהוא כפוף למספר מגבלות מופשטות. ישנן רמות שונות של גיוון בהתחשב במגבלות האלה, וסך הכל אפשר לחזות איך שפה יכולה או לא יכולה להתנהג.
המשפט השני של בורודיצקי לא נובע מכך כלל ועיקר; הלקסיקון דווקא זוכה לחשיבות לא מועטה בתיאוריות דקדוקיות עכשוויות. מה שבורודיצקי ועמיתיה מצאו הוא פשוט שבשפה ששמה דגש על נקודות מסוימות במה שנקרא סמנטיקה לקסיקלית – הסמנטיקה של מילים בודדות – הנקודות  הללו יהיו נגישות יותר לדובר. אם יש מילים נפרדות לגוונים של כחול, ההבדל כנראה יהיה נגיש יותר לדובר, אבל שתיהן ייוצגו במוח הדובר בתור שם של צבע. המחקרים האלה מרתקים כתמיד, אבל ספק אם הם נוגעים למבנה התחבירי העמוק יותר של השפה.

Read Full Post »

שיטוטים אקראיים בוויקיפדיה הביאו אותי לערך המפעים על שפת הסנטינלים/הסנטינליז/הסנטינליזים. אנחנו לא יודעים על השפה שלהם דבר, מלבד שהיא כנראה קרובה לשפות האנדמניות של האיזור. הסיבה שאנחנו לא יודעים דבר על שפת הסנטינלים היא שהם חיים באי מבודד ומתנגדים לכל קשר עם העולם ה"מתורבת".

אי צפון סנטינל נמצא באוקיינוס ההודי ונמצא בשליטת הודו, אבל השליטה הזו לא מתבטאת בדבר; כל משלחת שניסתה ליצור קשר עם הסנטינלים נתקלה בסירוב אגרסיבי ביותר, ובסוף הוחלט לעזוב אותם לנפשם. אני לא בטוח מה מהספרים שנכתבו עליהם ומנסיונות התיעוד השונים אמין יותר ואמין פחות, אבל אנקדוטה אחת אהובה עליי במיוחד: אחרי הצונאמי של 2003 2004, לא היה ברור אילו שבטים באיי האוקיינוס ההודי שרדו את הקטסטרופה. מסוק שנשלח לרחף מעל האיים ולבדוק חזר עם תשובה חד-משמעית: הסנטינלים שרדו. עובדה – הם ירו עליו חיצים.

באיזה מגרש שיחקתם? על מה חלמתם? מה היה באותם פעמונים שאהבתם כל כך? מאיפה באתם, אדוניי מהאנדמנים, ולאן אתם הולכים? דברו אלי, אני מקשיב.

Read Full Post »