Feeds:
רשומות
תגובות

Archive for אוגוסט, 2010

בטמקא דיווחו ביום רביעי (דרושים בארה"ב: מתרגמים מסלנג שחור לאנגלית):

הסוכנות הפדרלית למלחמה בסמים (DEA) פנתה לחברות תרגום בבקשה להעסיק תשעה עובדים המתמחים ב"אבּוֹנִיקְס", שם שהודבק לסלנג של אפרו-אמריקנים המערב את אוצר המילים האנגלי במבנה שפות אפריקניות.

מאמצי ארצות הברית למגר את הסחר בסמים נתקלו בקשיים בלתי צפויים. גם כשהם מצליחים להחדיר אמצעי הקלטה סודיים ולהאזין לעסקאות סמים – הם לא תמיד מבינים מה נאמר שם.

ואיך אפשר בלי:

גורמים שונים הביעו חשש כי המהלך ייתן לגיטימציה לשפה המבוססת למעשה על אנגלית קלוקלת. בתגובה, נחלצו בלשנים להגנת האבוניקס והבהירו כי השפה יכולה להיות מסובכת יותר ממה שנדמה.

אני לא מבין גדול באנגלית שחורה (וגם לא מבין קטן), אבל יש כמה נקודות מעניינות שקשורות לשפה הזו (וכשאני אומר דבר כזה, קוראינו הוותיקים כבר יודעים שבמהלך הרשומה אשעמם אותם עם דוגמאות תחביריות אבל בסוף אקנח עם סרטון יוטיוב).

AAVE

ראשית, ebonics הוא מונח לא-רשמי וקצת מיושן. בלשנים מכובדים, מכופתרים ומעונבים מעדיפים להשתמש בשם טכני כמו African American Vernacular English, AAVE, (אנגלית מדוברת אפריקנית-אמריקאנית) או Black Vernacular English, BVE. בכמה מקומות עוד קוראים לזה jive. כמו כל ניב של שפה טבעית, גם AAVE הוא מערכת יציבה בת חוקים רבים וסדורים ולא סתם כמה מילות סלנג זרוקות ביחד. הכתבה לא שוכחת לצטט בקצרה את פרופ' ג'ון ריקפורד, אחד מחוקרי AAVE הידועים בעולם, אבל אני לא בטוח שיש יסוד לסברה של המחבר לפיה AAVE מערבת "את אוצר המילים האנגלי במבנה שפות אפריקניות" (האם הם מתכוונים לערבית או לאפריקאנס? ניחא).

דקדוק

ניתן דוגמה קלאסית למבנה הדקדוקי המסודר של הניב. באנגלית מדוברת ישנו מבנה בשם wanna-contraction. המקור של המבנה הזה הוא ב-AAVE (אם אני לא טועה):

  • You want to go.
  • You wanna go.

עכשיו בואו נראה מה קורה אם משחקים עם זה קצת:

  • You want Eli Yishai to resign.
  • You want who to resign?!
  • Who do you want to resign?
  • *Who do you wanna resign?

הופה, מה קרה פה? ההסבר המקובל הוא שמילת השאלה who משאירה "עקבה" (trace) כשהיא עוברת לתחילת המשפט: Who do you want [him] to resign, ולכן המחרוזת want to לא יכולה להתמזג – יש משהו בלתי-נראה ובלתי נשמע באמצע! הנה נתנו הסבר תחבירי אלגנטי שמאיר חוקיות בדקדוק של הלהג ועל הדרך השתמשנו במבנים מופשטים מפחידים.

היבטים חברתיים

כמובן שאת מירב העניין מספקים ההיבטים הסוציובלשניים של AAVE. בהקשר הזה כדאי להזכיר, מלבד העבודות של ריקפורד, טור שכתב  ג'ון מקוורטר, חוקר AAVE וקריאוליסט, אחרי שהארי ריד (מנהיג הרוב הדמוקרטי בסנאט) אמר שלברק אובמה "אין מבטא כושי" ועורר סערה זוטא. הטור של מקוורטר נוגע בשלל עניינים שבתפר בין האוכלוסיה השחורה, האוכלוסיה הלבנה, השפה השחורה והשפה הסטנדרטית והוא מומלץ מאוד.

למעוניינים בדוגמה חיה אין מקור טוב יותר מאשר הסצינה האלמותית הבאה ב"טיסה נעימה" (תודה ליובל על התזכורת). בסרטון השני מעלה צוות ההפקה זכרונות יחד עם השחקנים שכתבו את הסצינה, ושימו לב שאפילו הם (שמופיעים בערך אחרי דקה) מתקשים להתייחס ל-AAVE (או jive) בתור יותר מקצת סלנג.

Read Full Post »

האם השפה משפיעה על המחשבה? סוף השבוע מפנק אותנו בשתי כתבות איכותיות בנושא והמסקנה היא: די כבר, למי אכפת.

טוב, אולי קצת אכפת. כשהתחלתי לכתוב על המחקרים בנושא לא חשבתי שתוך שנה הם יהפכו ללהיט של עולם המדע הפופולרי, אבל זה רק מראה עד כמה אני מנותק כאן במגדל השן שלי. על כל פנים, מי שקורא בצמא ובשקיקה את הרשומות שלנו בנושא ודאי ישמח לעיין בשני כתבות נוספות.

הכתבה הראשונה היא מאת איתי להט (שעושה עבודה יפה לאחרונה) בכלכליסט (ביידיש זה נשמע יותר טוב, 26/8/10). כותרת המשנה: "מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע". מלבד כמה אי-דיוקים מזעריים וכמה טענות מגוחכות לגבי יכולות מתמטיות של ילדים (שלמרבה המזל לא נבעו מלהט עצמו), מדובר בסקירה נאה ביותר.

הכתבה השנייה היא טור של לא אחר מאשר גיא דויטשר, שעיבד פרק מהספר החדש שלו עבור הניו יורק טיימס (Does Your Language Shape How You Think?, 26/8/10). הכתיבה של דויטשר קלילה ונינוחה כתמיד, והוא מצליח לתמצת יפה את הנושא בלי להיגרר להצהרות חסרות כיסוי על טבעה של השפה.

כאמור, מי שקורא על הנושא הזה אצלנו לא ימצא כאן הרבה דברים חדשים, ובכל זאת שתי אנקדוטות לא היו מוכרות לי קודם לכן: אחת היא מהטור של דויטשר ונוגעת לדובר גוגו ימיד'יר (שבט שמשתמש ברוחות השמיים כמו מזרח-מערב במקום בכיוונים כמו ימין-שמאל) אשר הגיע לכפר אחר ולא הצליח למצוא את הידיים והרגליים משום שמזרח ומערב כבר לא היו כל כך ברורים לו.
השנייה היא מהכתבה של להט, על שופטי כדורגל ששורקים (אולי) בהתאם לכיוון הקריאה והכתיבה שלהם.

אין לי עוד מה להגיד על הכתבות האלה, אבל זה יכול להיות מקום טוב לשוחח עליהן אם חם לכם מדי לצאת החוצה השבת.

מחקרים עדכניים מגלים איך שפת האם מכתיבה את יכולתנו לתכנן, לנווט, להשקיע בתבונה, לזהות צבעים וליהנות מהרגע

Read Full Post »

[פוסט אורח מאת אדם מתן]

ויקיפדיה - לוגו

האם אפשר להגדיר את מידת הדמיון בין שפות, שלא דרך מחקר בלשני?

נחשוב לרגע על קרבה בין שפות (ותרבויות). אפשר להניח, למשל, ששפות שדובריהן שוכנים זה בקרבת זה, תהיינה קרובות יותר זו לזו מאשר שפות הנמצאות ביבשות שונות. הקשר הלשוני בין שפות שונות נחקר מזה מאות שנים; אותי עניין לחקור את הנושא מזווית אחרת, של קיום מונחים זהים בשתי השפות.

נגדיר את המרחק בין שפות כסבירות לכך שמונח שקיים באחת קיים גם בשניה. כך למשל, יש סיכוי טוב שהביטוי "חמסין" יהיה קיים גם בעברית וגם בערבית, אבל סיכוי נמוך לכך שהוא קיים גם בשפת הנאוואחו. זו גישה שמתעלמת לגמרי ממבנה המילה, מהתקופה בה המילה נכנסה לשפה וממספר הדוברים הילידים המכירים את המילה; השיטה חוקרת רק את כמות המונחים משותפים לשתי השפות, ואולי גם את איכותם ותפוצתם.

מכיוון שסריקה מילונית היא עסק מסובך מאוד, החלטתי לעשות לעצמי הנחה מסויימת ולהשתמש בערכים בויקיפדיה כמקור. כלומר, הקשר בין שתי שפות ייקבע לפי מספר הערכים המשותפים לשתיהן. אפשר, כמובן, להרחיב את הבדיקה הזו למשפחות של שפות, כלומר לנסות למצוא קבוצות של שפות שמאופיינות על ידי מילים משותפות. חשוב גם לציין שבבדיקה הזו יש לא מעט בעיות והטיות סטטיסטיות – אבל הנושא עדיין מעניין מספיק בשביל לבדוק אותו.

כדי לבדוק את העניין כתבתי סקריפט קטן בפייתון. הסקריפט לוקח בכל פעם ערך אקראי מויקיפדיה העברית, ושומר בטבלה את רשימת השפות בהן מופיע הערך, למשל:

http://he.wikipedia.org/wiki/תא_אפנדימלי

en, ar, de, es, fa, fr, it, ja, pl, ru, sk, sl, sv

כלומר, הערך "תא אפנדימלי" קיים גם באנגלית, ערבית, גרמנית, ספרדית, פרסית, צרפתית, איטלקית, יפנית, פולנית, רוסית, סלובקית, סלובנית ושוודית. לעומתו, הערך "כ"ו בכסלו" קיים רק בעברית וביידיש (כן, יש פרייער ענציקלאפעדיע גם ביידיש, עם יותר מ7,000 ערכים – עסק מעניין בפני עצמו).

נצא מנקודת הנחה שמספר השפות אליהן מתורגם הערך הופכי לחשיבותו. כלומר, הערך על התא האפנדימלי תורגם ל13 שפות ולכן מספק אישוש חלש לקשר בין השפות, ואילו "כו בכסל"ו" תורגם רק לשפה אחת, ומספק לנו אישוש חזק בהרבה על הקשר בין עברית ליידיש.

כדי לכמת את הקשר, נגדיר את המקדם של כל ערך בויקיפדיה להיות ריבוע מספר השפות אליו מתורגם הערך. המקדם של הערך על התא האפנדימלי הוא 169 (13 בריבוע), ואילו המקדם של "כו בכסלו" הוא 1 (1 בריבוע). עבור כל ערך שנדגם, כל אחת משפות התרגום קיבלה ניקוד ההופכי למקדם. כלומר, סלובנית, שוודית ושאר השפות שהערך על התא האפנדימלי תורגם אליהן קיבלו 1/1690.00592 נקודות כל אחת עבור הערך, ואילו יידיש קיבלה נקודה אחת עבור כ"ו בכסלו.

צברתי את הערכים עבור 4,003 ערכים אקראיים מהויקיפדיה העברית (שהם כ4% מהערכים) והרי התוצאות:

ro 6.238
fi 6.302
sv 8.027
ar 8.420
ja 10.426
cs 10.829
pt 10.914
nl 13.281
es 14.357
it 15.747
yi 19.878
pl 20.503
ru 22.485
fr 30.873
de 31.004
en 290.949
831.000

קצת פרשנות

את מספר הנקודות הרב ביותר קיבל ה"אין תרגום", כלומר ערכים שאינם קיימים בשפות אחרות. צריך להזהר מעט מהנתון הזה, משום שיכול מאוד להיות שהערכים קיימים בשפות אחרת אך אף ויקיפד לא יצר קישור ביניהן. בכל מקרה, הנתון הזה מעניין כי הוא יכול לאפיין את היחידאות, או הבידוד, של שפה מסויימת.

השפות הבאות בתור, לפי סדר ניקוד יורד, הן אנגלית (290.9), גרמנית (31.0), צרפתית (30.87), רוסית (22.49), פולנית (20.50), יידיש (19.88) ואיטלקית (15.74). מעניין לשים לב לכך שהשפות הנפוצות בויקיפדיה, לפי סדר יורד, הן אנגלית, גרמנית, צרפתית, פולנית, איטלקית, יפנית וספרדית. הנתון המעניין כאן הוא שתי השפות שמספר הערכים המשותפים להן ולעברית גדול בהרבה מהסבירות הסטטיסטית – יידיש ורוסית. וכאן נראה לי שהצלחנו לקלוע יפה.

רעיונות…

  • עוד הרצות: אני מחכה בכליון עיניים להרצה הבאה של הסקריפט – על היידיש (אני מצפה לד מיון לעברית ולגרמנית), על שפה סקנדינבית ועל שפה מזרח אירופית.
  • ללמוד על מנגנון הקישורים הבין-לשוניים בויקיפדיה. איך נוצרים קישורים בין שפות? האם מדובר בתהליך חצי אוטומטי, או ידני לחלוטין?
  • התאמה סטטיסטית: לעבוד על ניתוח סטטיסטי תקף יותר לנתונים.
  • העלאת התוצאות לרשת בצורה מסודרת, אולי דרך אפליקציה בגוגל.
  • ויזואליזציה, אולי באמצעות דיאגרמות ון.
  • תרבויות ושפות: האם ייתכן שלא מדובר בקרבה בין שפות, אלא גם בקרבה בין תרבויות? למשל, הקשר בין רוסית לעברית יכול לנובע מקיומה של קהילה גדולה הדוברת את שתי השפות, ומתרגמת ערכים. זו מחשבה שהופכת את הפרוייקט, בעיני, למעניין הרבה יותר.

אשמח לתגובות.

[פוסט אורח מאת אדם מתן, מפתח תוכנה במקצועו, וסקרן תמידי בזמנו הפנוי. בוגר (בקרוב) של לימודי מדעי המחשב ותכנית כללית למדעי הרוח באוניברסיטה העברית. הפוסט פורסם במקור בבלוגו "הבלוג הכחול"]

Read Full Post »

חוקר התרגום איגנסיו גרסיה מאוניברסיטת מערב סידני הוא מאמין גדול בתרגום מכונה, והוא החליט לבדוק האם מערכות תרגום אוטומטיות יכולות לסייע למתרגמים בשר-ודם. במחקר שהתפרסם לא מזמן הוא נתן למספר סטודנטים לעבוד על טקסטים באנגלית ולתרגם אותם לסינית. עבור חצי מהטקסטים השתמשו המתרגמים בתרגום אוטומטי של גוגל כבסיס, והתוצאות היו – אולי במפתיע – טובות.

המשתתפים קיבלו ארבעה טקסטים, שניים בנושאי משפט ושניים בנושאי רפואה (יותר ברמת ויקיפדיה מאשר ברמת כתב עת מקצועי, אם לשפוט מהדוגמאות במאמר), עם גיוון מתבקש בסדר הצגת הטקסטים בין המשתתפים השונים. לא הותר שימוש במילונים, מרשתות ועזרים דומים. בשני טקסטים הופיע תרגום המכונה של גוגל בתור הטקסט המתורגם, ואותו שינו המתרגמים; בטקסטים האחרים, טקסט היעד היה זהה בתחילת העבודה לטקסט המקור. גרסיה ביקש לבדוק שני דברים: האם יש הבדל באיכות, והאם יש הבדל במהירות.

לגבי המהירות, 15 מתוך 28 הנבדקים עבדו מהר יותר עם עזרה של תרגום מכונה, כלומר בקושי יותר מחצי. גם בין המשתתפים ובין עצמם היה קשה לזהות נטיות: רבים מהסטודנטים עבדו מהר יותר עם תרגום מכונה על טקסט אחד אבל לאט יותר על טקסט אחר; וכמעט כולם עבדו לאט יותר על המטלה הראשונה, לא משנה מה היתה (תחושה שוודאי מוכרת למתרגמים רבים).

בעניין האיכות אפשר כבר לזהות מגמה: מתוך 56 תרגומים, 33 תרגומים מתרגום מכונה נוקדו על ידי בוחנים חיצוניים כטובים יותר. ציונים ממוצעים (מתוך 50) לתרגומים היו 33.8 עבור התרגום הסטנדרטי ו-36.4 עבור תרגום עם בסיס של תרגום מכונה (הציונים נעו בגדול בין 30 ל-40). שבעה משתתפים ניפקו תוצר טוב יותר עם בסיס של תרגום מכונה ושניים סיפקו תוצר גרוע יותר.

המשתתפים בניסוי רואיינו בתחילתו ובסופו לגבי העדפותיהם, וניתן היה להתרשם שהם חשבו שתרגום המכונה הוא רעיון טוב, במיוחד לאחר שניתנה להם הזדמנות להשתמש בו. בין הערות הסיום שלו, גרסיה גם מעלה את האפשרות שלחלק מהסטודנטים עשוי להיות ניסיון קודם בעריכת תרגומי מכונה, "בניגוד להמלצות המרצים שלהם". הבה נצא במחול ונרקוד את תרגום המכונה.

Ignacio Garcia (2010). Is machine translation ready yet? Target 22:1, 7–21.

Read Full Post »

בואו נדבר עוד קצת על המאמר של ניק אוונס וסטיבן לוינסון. ישבתי וקראתי אותו: מאמר של שני בלשנים מוערכים, 23 תגובות, ותגובת-נגד של המחברים. לפני שניכנס בעובי הקורה מומלץ לקרוא את ההסבר הקצר על הגישה החומסקיאנית ו/או את הסקירה הראשונית שלי בנושא (וגם את הדיון המעניין בתגובות), אם איכשהו פספסתם. שם נזהרתי לא לדבר יותר מדי על המאמר עצמו אלא על כתבה שתיארה אותו. עכשיו אנסה לפרוט את הדיון לפרוטות, בשלושה חלקים עיקריים. אוונס ולוינסון לא מסכימים עם החומסקיאנים ואומרים כך:

  1. אין תופעות אוניברסליות בשפה.
  2. השיטה הגנרטיבית לא עובדת.
  3. צריך תכנית מחקר אחרת.

למען הסר ספק, זהו דיון עכשווי כבד-ראש בשאלה בסיסית מאוד שנוגעת לשפה האנושית: איך. לעזאזל. היא. מתפקדת.

תופעות אוניברסליות בשפה – יש או אין

בלב העניין עומדת טענה של אוונס ולוינסון (להלן או"ל) לפיה אין תופעות אוניברסליות בשפה טבעית, כלומר דברים שנכונים לגבי כל שפה באשר היא ומהווים "דקדוק אוניברסלי" (UG, universal grammar). לאורך השנים הושמעו סברות רבות לפיהן לכל שפה יש אבחנה בין שמות עצם לפעלים; רקורסיביות; חלוקה תחבירית לצירופים שונים (צירוף שמני, צירוף פעלי וכן הלאה, מה שמכונה בלעז constituents); ועוד ועוד. או"ל מסתכלים על מספר גדול של תופעות ואומרים: הבל הבלים הכל הבל. המגוון העצום של השפות הקיומות מוכיח שאין תופעות אוניברסליות, לדבריהם, והם נותנים רשימה של הפרכות.

יש שתי בעיות עם הטענה הזו. הראשונה היא שהם קצת טועים, כי הניתוח שלהם מוטעה. על כך בחלק הבא של הרשומה. הבעייה השנייה היא איך מגדירים תופעה אוניברסלית. למשל, היום ברור שלא לכל השפות יש מילה עבור המספר 3 וגם ברור שיש שפות שבהן אפשר לסמן את הזמן על שם העצם ולא רק על הפועל, שני דברים שפעם נחשבו לבלתי אפשריים. מנגד, כשחומסקיאנים מדברים על מאפיינים אוניברסליים של שפה, הכוונה היא בדרך כלל למבנה תחבירי מופשט יותר: בכל שפה יש נושא ונשוא; אם בשפה יש צורת זוגי, יש בה בהכרח גם צורת רבים; בעץ תחבירי כל ענף מתפצל לכל היותר לשני ענפים אחרים; ושאר עקרונות מופשטים יותר. הדקדוק הגנרטיבי מחפש לנתח את התופעות הללו ולתת להן תיאור פורמלי.

מתבקש לומר, אם כן, שאם אין תופעות אוניברסליות, אזי הנחת היסוד שעומדת בבסיס הגישה הגנרטיבית ואותו דקדוק אוניברסלי היא שגויה: אין מה לתאר את כל השפות באבחה אחת, כי כולן שונות זו מזו באופן מהותי.
איך ניתן לבדוק את זה? האמת שאם לא בצורה תיאורטית (כל השפות זהות בבסיסן המופשט, כי עובדה שילד יכול ללמוד את כולן) אז בצורה אמפירית: האם הדקדוק הגנרטיבי מתאר שפות היטב, או שהוא שיטה כושלת בת כושלת? או"ל מפקפקים בכוחו.

דקדוק גנרטיבי כשיטה מדעית

או"ל מציגים שורה של תופעות תחביריות ולשוניות ומנסים להראות שההסברים של הגישה הגנרטיבית פשוט לא מצליחים לתאר אותן כמו שצריך. הם טוענים שרקורסיה לא הכרחית באף רמה, למרות שרקורסיה נחשבת לאחת מאבני היסוד של הבלשנות החומסקיאנית: לא ברמת המשפט השלם (עם הדוגמה שהופרכה משפת שבט הפיראהא) ולא ברמת המילה הבודדת. הם מראים עוד איך צירופים תחביריים הם דרך אפשרית – אבל לא הכרחית – לסדר מילים במשפט, משום שסדר המילים והצירופים במשפט הוא לא משהו שעוזר לשומע להבין את הנאמר (עמ' 441). לכן, הנסיון הגנרטיבי להכניס כל שפה לסד הצירופים התחביריים נדון מבחינתם לכשלון.

התגובה של התחבירן רוברט פריידין מעניינת במיוחד: הוא טוען בפה מלא שנתונים משפות אחרות (קרי משפטים שבהם יש תופעות "מוזרות") לא יכולים להפריך תיאוריה אם הם אינם חלק מתיאורה אלטרנטיבית, משום שבתאוריה קיימת יש מספר רכיבים שמשתלבים זה בזה. זו הצהרה מעט מפתיעה, אבל נדמה לי שהנקודה שלו היא כזו: ברגע שאנחנו אומרים שיש מבנה תחבירי מופשט, אנחנו צריכים לתאר מספר גורמים ומכניזמים שעובדים בתוכו. תוצאה סופית של מערכת כזו – שוב, משפט בשפה טבעית – מושפעת מכל הגורמים והמגבלות הללו, ולכן היא עשויה להיראות כאילו היא סותרת גורם כלשהו נקודתית; אבל הסתכלות מעמיקה יותר תגלה שלא כך היא. אני לא יודע אם הייתי מנסח את הטיעון שלי בצורה דומה, אבל נראה לי שכאן חבוי חלק עיקרי במחלוקת: מבחינת או"ל הכל חייב להסתדר יפה על פני השטח, ואותו ההסבר חייב לתפוש לגבי כל המידע מכל השפות בהתייחס לכל גורם שאמור להיות קיים במערכת. מבחינת פריידין ואחרים, יש בעיה בתיאוריה רק אם המבנים והתהליכים שהיא מגדירה אינם מסוגלים להסביר את הצורה השטחית שמתקבלת בסוף כתוצאה מהשילוב ביניהם.

ניבויים

בן לי תהה בפניי – וכמוהו בלשנים, פסיכולוגים התפתחותיים ואנתרופולוגים, רק לא בפניי – האם זה לא קצת מגוחך שהתיאוריה נהיית יותר ויותר מופשטת עם כל "הפרכה" (למשל, שצירופים תחביריים אינם המנגנון העיקרי לסידור מילים במשפט [כביכול]). מבחינת הגנרטיביסטים זה דווקא טוב: ככל שמנסחים תהליכים מופשטים יותר שיוצרים מודל טוב יותר של מה שקורה במוח, התיאוריה הולכת ומשתפרת. עכשיו, תיאוריה טובה צריכה לסוגל לנבא תופעות. אז הנה ניבוי אחד: כל שפה שמבדילה בין צורת יחיד וצורת זוגי תבדיל בהכרח גם בין צורת זוגי לצורת רבים. ועוד אחד: ישנן שפות שבהן יש צורת משולש, אבל לא תהיה שפה שבה צורת מרובע.

אז אולי ננסה לנבא תופעות ולראות איך זה מסתדר עם שפות חדשות? הבעיה היא שאין באמת שפות "חדשות": בלשן מתאר שפה כלשהי, ואז בא תיאורטיקן ומראה איך היא משתלבת בתוכנית מחקר כזו או אחרת (גנרטיבית, פונקציונלית, לא משנה). השפות ה"חדשות" היחידות שבאמת צצות מאפס הן שפות סימנים, ולמרבה הצער חוקרי שפות סימנים עדיין לא הגיבו על המאמר. אבל תשמחו לשמוע שמזה כמה עשורים מקובל לנתח שפות סימנים בכלים הגנרטיבים המקובלים, ותנחשו מה – הן מתנהגות בדיוק כמו שפות דבורות, ללא צורך להוסיף אף רכיב מיוחד למערכת. שזה נחמד.

המתודולוגיה של או"ל

הניתוח של או"ל את מגרעות השיטה הגנרטיבית קיים בשני רבדים: ראשית, הם מנתחים מידע קיים, ושנית, הם מסיקים מסקנות לפי הניתוח שלהם. הבעיה היא שבלשנים רבים טענו שאו"ל שגו בניתוח הראשון, מה שהוביל לניתוח מוטעה לחלוטין ברובד השני: דיוויד פסצקי הנכבד נזף בהם על ציטוטים לא מדויקים ועל התעלמותם ממחקרים שגיבשו צורות מעניינות להסתכל על שפות "בעייתיות" כמו וורלפירי; אנדרו נווינס (ההוא מהשריקות) הסביר את תפישת עולמו הפונולוגית ותיקן מספר ציטוטים; פריידן הנדון לעיל הפנה את או"ל למאמרים מלפני 20 ו-30 שנה שמתייחסים להיבטים של היררכיה, נושא שאו"ל ביטלו כלאחר יד; מארק בייקר, לואיג'י ריצי ושאר שמות בעלי משקל ניסו להסביר איך המחקר שלהם דווקא משקף יפה מאוד את מה שקורה בשפות העולם ואיך או"ל מתעלמים מההישגים האלה במופגן.

כך לדוגמה, או"ל מתעכבים על העובדה שמילות שאלה באנגלית (Wh-questions) מופיעות בתחילת המשפט אבל בסינית הן מופיעות בסוף המשפט. מקובל לומר שמילת השאלה "זזה" לתחילת המשפט, מה שמפריע לאו"ל מאוד, משום שבסינית היא לא זזה, אלא אם מניחים שהיא רק זזה באופן מופשט. בין המגיבים, ריצי, פסצקי, וסמולנסקי ודופו טורחים לציין שישנן מגבלות מסוימות על מילות שאלה שחלות עבור שתי השפות. אחת המגבלות היא באמת מופשטת וגורסת שישנה סימטריה בין מילות השאלה באנגלית ובסינית; מילות שאלה באנגלית מופיעות היכן שמילות שאלה סיניות אינן יכולות להופיע, ולהיפך. בהתחשב בזה, ביקורת כמו זו של מייקל טומאסלו (ביקורת שטחית ומאכזבת מפי מדען מבריק) נראית מגוחכת: הוא טוען שלדקדוק הגנרטיבי אין יכולת להסביר את מילות השאלה בסינית. נו, באמת.

בתגובת-הנגד שלהם, או"ל מזכירים שחילזון לא מכיל את המבנה המופשט של הקונכיה בתוך המוח שלו. זה כנראה נכון, אבל זו לא הנקודה: אפשר לתאר איך מודל כזה נראה, ואו"ל לא יכעסו כשנאמר שקונכיה יכולה להיות בצורת ספירלה לוגריתמית אם זה המודל שמתאר אותה.
נחזור לשפה הנהדרת וורלפירי, שנחשבת "לגולת הכותרת של השפות בעלות סדר מילים חופשי" (פסצקי). כבר לפני שני עשורים תיאר קן הייל הנערץ איך הפועל חייב להופיע במקום השני במשפט, ומשם ניתן היה להסיק עוד כמה מגבלות תחביריות על השפה (שתוארו בעבודת דוקטורט של ג'סיקה לגאטה לפני כמה שנים). או"ל לא נותנים את וורלפירי כדוגמה, אלא את ג'יווארלי שעדיין לא הוסברה בצורה דומה. שני הצדדים צודקים בתת-הוויכוח הזה: מבחינת או"ל, הנה שפה עם תופעה שסותרת עקרונות אוניברסליים. מבחינת פסצקי, השפה פשוט עדיין לא נחקרה כראוי, וכשתיחקר כמו וורלפירי, ניתן יהיה להסביר אותה כמו שצריך. או"ל מסרבים לחכות.

אם כך, מה בעצם הגישה של או"ל? הם מתעקשים שהם כן מעוניינם בתיאוריה בריאה ובעלת הכללות, אבל רוצים לעשות זאת מתוך הסתכלות אבולוציונית-תרבותית.

האלטרנטיבה

אמרנו שמבחינת או"ל אין טעם לבנות מודל של איך השפה קיימת במוח שלנו. אז מה כן? הם אומרים שצריך להסתכל על הגורמים שהובילו ליצירת שפה אצלנו. ישנם גורמים פסיכולוגים, קוגניטיבים, פונקציונליים, התפתחותיים ותרבותיים שגורמים לכך שהשפות שלנו נראות כמו שהן (ולכך שרבות מהן נראות דומות). את הגורמים האלה הם מעוניינים לבודד: האם מגבלות חישוביות מסוימות גורמות לכך ששפות מסוימות אינן רקורסיביות? האם הרגלים תרבותיים גורמים לכך שאנחנו אוהבים לרוב שפות עם נושא ונשוא? בעיני או"ל, הגורמים קבועים עבור כל המין האנושי, אבל המגוון והשפות לא.

השוואה מעניינת עורכים או"ל בין שפה טבעית ובין יכולות אחרות שאנחנו לומדים; הרי אין טעם לומר שהיכולת לרכוב על אופניים או לנגן בפסנתר היא מוּלדת – מה שמולד הוא היכולת ללמוד איך לרכוב תודות לשימוש במספר יכולות בסיסיות אחרות (עמ' 443). בכל זאת נראה לי שצריך להיזהר עם השוואות כאלה, בין היתר משום שלא כולנו יכולים לנגן בפסנתר טוב באותה מידה, לא משנה כמה נתאמן, אבל לכולנו תהיה שליטה דומה (אם לא זהה) בשפה.

אפשרויות פסולות, אפשרויות קבילות

ומה לגבי טענות כמו אלה של הבלשנית מגי טלרמן, שמזכירה שאותם פתרונות מופיעים בשפות שונות לחלוטין (גם לטינית וגם קלקטונגו משתמשים במערכות יחסות; גם באסקיית וגם שפות כמו דירבאל משתמשים בהפרדת ארגטיב-אבסולוטיב)? במידה רבה, זה שוב הצד השני של המטבע האו"לי, וניתן לראות בזה טיעון לכאן או לכאן.

דברים דומים אומרים האדונים המנוסים סטיבן פינקר וריי ג'קנדוף, תומכי UG מושבעים. בתגובתם הם מציגים כמה שפות תיאורטיות ומנחשים שאף פעם לא תהיה שפה כזו: שפה שבה כל המילים בנות הברה אחת, שפה שכולה תחשיב פרדיקטים, שפה שכולה תווים מוזיקליים וכן הלאה. הם גורסים שמשהו חייב להגביל את מרחב האפשרויות הקבילות, ומשערים שאם המגבלות האלה יוגדרו בצורה מפורשת, מה שיתקבל יהיה מאוד UG-י. או"ל עונים (1) שלשפות לא היה הרבה זמן להפוך למגוונות מאוד, (2) שהמגבלות הללו נובעות, כאמור, ממגבלות קוגניטיביות או פונקציונליות (3) ושבכמה שפות דווקא ישנם מאפיינים דומים, למשל השימוש של יאו ומאסאי בטון כדי להביע יחסים תחביריים.

מעניין לראות שהאנתרופולוגים, הפסיכולוגים ושאר הלא-בלשנים שהגיבו על המאמר תומכים באו"ל. נראה לי שיש שתי סיבות: הראשונה היא שהגישה של או"ל מאוד קוסמת לפסיכולוגים אבולוציוניים משום שהיא עצמה גישה אבולוציונית – מהם המרכיבים הבסיסיים (הקוגניטיביים והתרבותיים) שהולידו את השפה? הסיבה השנייה היא שהמודלים הבלשניים הקיימים הם באמת מופשטים ומסובכים, ולא בהכרח יהיו נהירים למי שבא מחוץ לתחום. אני בספק אם זה צריך לפטור חוקרים שבאים מדיסיפלינות אחרות מלנסות ולהבין אותם.

סיכום

הדיון שאו"ל מנסים לעורר נסוב על שאלה עיקרית אחת: האם יש מאפיינים אוניברסליים לשפה טבעית. הם טוענים שלא, ושהמגוון העצום של תופעות לשוניות ושל שפות הוא מה שצריך להנחות את חקר השפה. הזרם הגנרטיבי טוען שכן, ושהמבנה הבסיסי של כל השפות הוא זהה ואותו יש לחקור. כפועל יוצא של הנחת היסוד, שתי הגישות מסמנות תוכניות פעולה שונות: או"ל רוצים לראות מה הגורמים שמשפיעים על היווצרות שפה והם מזכירים מגבלות קוגניטיביות/חישוביות, התפתחות אבולוציונית, השפעות תרבותיות ומטען גנטי; הזרם הגנרטיבי לא מתעניין באופן מפורש באיך הגענו לכאן ובמקום זה הוא מנסה לבנות מודל של השפה הקיימת.

חלק גדול מהדיון הזה חשוב ומועיל, וחלק גדול עוד יותר הוא עקר. הרי מינימליזם, LFG, אופטימליות, טיפולוגיה, בלשנות השוואתית – כולן מתודות חקר בלשני שונות, אבל כולן בסופו של דבר עיוורים שממששים את הפיל במקומות שונים. אני במקרה חושב שלמינימליזם החומסקיאני יש ידיים גדולות יותר, אבל אין טעם לשלול את עצם קיומו של אופן הסתכלות אחר כל עוד הוא יוצר מסגרת עקבית ומסוגל לנבא בהצלחה תופעות נוספות. שווה להזכיר פעם נוספת שהמקום היחיד בו באמת אפשר לראות שפות חדשות נוצרות מאפס הוא אצל שפות סימנים, והתרומה של חוקרי שפות לא-דבורות לדיון הזה עשויה להיות חשובה מאוד.

אם לסכם את מחשבותי המשוחדות בנושא: דקדוק גנרטיבי עובד מצוין וההכללות שלו שרירות וקיימות, למרות הנסיונות של אוונס ולוינסון להפריך אותן. ישנו אוסף של תכונות שמאפשר לנו לרכוש שפה, שפה שמוגדרת על ידי מגבלות שונות. האם אפשר לקרוא לזה בשם כמו "איבר שפה", "אינסטינקט שפה" או "חוש לשפה"? ניחא. למה לא. אין לנו אוסף תכונות או "אינסטינקט" לתעופה (בניגוד לציפורים), אין לנו אינסטינקט לשימוש בחדק (בניגוד לפילים), ואין לנו אינסטינקט שמאפשר לנו למצוא את הדרך חזרה לכוורת ולהביע את המסלול הזה באמצעות ריקוד (בניגוד לדבורים). אבל יש לנו אוסף תכונות שמאפשר לנו לתקשר באמצעות שפה.

ודאי תשמחו לשמוע שגליון שלם של כתב העת Lingua יוקדש למאמרי-המשך. איזה כיף! בינתיים ניסיתי לתאר כאן את עיקרי השיח, ולא לסקור את המאמר כולו על שלל הצהרותיו תגובותיו. אם יש שאלות נוספות, זה המקום לשאול. ואם קראתם את כל הרשומה, מגיע לכם בונוס אוניברסלי:

Nicholas Evans and Stephen C. Levinson (2009). The myth of language universals: Language diversity and its importance for cognitive science. Behavioral and Brain Sciences 32:429–492. doi:10.1017/S0140525X0999094X

Read Full Post »

ויינט פרסמו ביום שני, סמוך לשעה השמחה של הבוקר, כתבה עם כותרת בזו הלשון (צילומסך למטה, כשתגיעו תבינו למה החבאתי):

עו"ד הנידונה למוות באיראן ברח לנורבגיה

לפני שנחליט אם ללמד את העו"ד קודם בוקמול או נונורסק, צריך להחליט מה לעזאזל הולך פה. רובנו, ואני מניח שגם רובכם, הרגשנו מועקה קלה בעיבוד המשפט הזה, שנראה כאילו מתחיל בנושא נקבה ועובר לדבר עליה בנשוא זכרי. למי שלא חש כאן את המועקה, נסביר שהקרי הראשוני שעלה לרובנו הוא: יש עורכת-דין, דנו אותה למוות באיראן, ועכשיו היא בורח (?!?) לנורבגיה. מי התייר האנגלו-סקסי שכתב את זה?

אז לא. דודי כהן (לפי הכתבה עם הכותרת המתוקנת, כאן), או העורכים שלו, התכוונו למבנה סמיכות: עורך-הדין של הנידונה-למוות-באיראן הוא הבורח. ואני מתמוגג כאן מכל רגע, כי כל כמה שניות עולה לי עוד דו-משמעות מורפולוגית/תחבירית שגרמה לרובנו לא להבין את הכותרת בקריאה ראשונה. הבה ניתן בהן סימנים.

  1. עו"ד הינה צורה שאינה מסומנת כזכר או נקבה, כלומר יכולה להיות שניהם. יודרשת התכוונו לעורך-דין, אנחנו פירשנו כעורכת-דין (בגלל הפועל הסמוך נידונה).
  2. קֶשר הסמיכות שבין המילה הראשונה לשנייה אבד אצלנו, ופורש כרווח שבין שם-עצם ופסוקית זיקה המתייחסת אליו.
  3. ה-ה שבראש המילה הנידונה משמשת כה"א הידיעה בקרי המקורי, ואצלנו פורשה כהתחלה של פסוקית זיקה (מה שיכול להחליף את ש- בפעלי בינוני).
  4. באיראן משמשת במקור כלוואי (שממשיך לתאר את הנידונה למוות), ואצלנו פורשה כתיאור מקום (של דין המוות).

שתי דרכים להפיג את העמימות נוסף על הדרך המתחכמת בה נקטו העורכים, שביטלה את דו-משמעות (1): לטפל ב-(2) ע"י פירוק הסמיכות (עוה"ד של הנידונה למוות באיראן), מה שמקל על הקריאה מיידית אבל ארוך במילה; או לטפל ב-(4) ע"י החלפה בשם-תואר (עו"ד הנידונה למוות האיראנית), מה שעדיין עושה קצת חלושעס, אבל כבר במילה הרביעית.

עוד כדאי לציין, שאלו מאיתנו שהבינו ישר את הכוונה המקורית הודו (תחת עינויי מלקות) שההקשר עזר להם מאוד. סיפורה של הנידונה למוות הספציפית הזאת פורסם בהרחבה בחודש האחרון. עוד עוד (עו"ד) כדאי לציין, שלו היתה העו"ד נקבה, כלומר בכותרת היה מופיע "ברחה" במקום "ברח", כנראה לא היינו יודעים עד שלב מאוחר למדי בקריאת הכתבה עצמה מה באמת קרה.

הרי לנו, אם כן, על פי הפרוגרמה החדשה (יותר נכון, המתוקנת), משפט-שאינו-חולצה (Garden Path) כהלכתו. המשיכו לשלוח מרכולתכם, ואל תשכחו לצלמסך!

(הינד כובע לאבנר קשתן, צלם המסכים המדופלם)

עו"ד הנידונה למוות באיראן ברח לנורבגיה

Read Full Post »

תקציר: 1) משפטי חולצה הם לא משפטי חולצה. 2) אנחנו צריכים שם חדש למה שעד עכשיו נקרא "משפטי חולצה". 3) אנחנו בהטוויטר! לא צריך להירשם או לעשות שום דבר מיוחד, רק ללחוץ על הקישור: dageshkal@.

פעם סיפרתי על "משפטי חולצה". זה נהיה להיט קטן, אבל יש בעיה אחת שמפריעה יותר ויותר לחברי המערכת כאן: קצת פישלתי בהגדרה. אמרתי שמשפט חולצה הוא garden path sentence, משפטים שנראים בסדר גמור אבל שדו משמעות לקסיקלית מפילה אותם בסוף, יוצרת כשל תחבירי קטסטרופי וגורמת לנו לקרוא אותם מהתחלה:

  • The horse raced past the barn fell
  • The Russian women loved died
  • Fat people eat accumulates (ת' ליואב)
  • כשיהודים בונים בניינים נופלים (ת' לבן לי)

תע"ג הגדירה זאת כך: "כשמגיעים למילה האחרונה כל המשפט קורס". אלה משפטי garden path, ואנחנו צריכים שם טוב עבורים. כאן ההזדמנות שלכם להציע שם מוצלח בתגובות או לצייץ אותן לעברנו ב-dageshkal@.

עד כאן הכל טוב ויפה, אבל אם אלה לא משפטי חולצה, מה כן?
אה, אז זהו. הגורואים שלנו משתמשים במונח Crash Blossoms עבור כותרות קצרות באמצעי התקשורת שבהן אחת המילים דו-משמעית ומכשילה קריאה נורמלית של המשפט (לפעמים אפשר לקרוא את המשפט בכל זאת והוא עדיין יהיה תקין, ולפעמים לא). האם באמת יש צורך בהפרדה בין שני הסוגים האלה? לא יודע. משפט Crash Blossom אפילו מוגדר כמקרה פרטי של Garden Path. אבל כמו שאמרתי כמה פעמים כשדיברנו על המינוח:

באמת התחוור לי מוקדם יחסית שאכן יצרתי מפלצת!
עושה רושם שהקוראים שלי זורקים את כל סוגי ההומונימיה וה-GP לתוך קלחת אחת כי לא טרחתי להפריד ביניהם. מצד אחד, זה קצת חבל. מצד שני, אנשים פתאום חושבים על דקויות תחביריות ודנים בשאלה האם משפט מסוים הוא משפט חולצה או לא ואיזו מין דו-משמעות טמונה בו. אז למרות הקנאות שלי למינוח נכון, קשה לי להיות מתוסכל מזה.

וכשמיכאל ז. התלונן ש-"בקיצור, חבל על המאמצים שלי. לא מבין אף אחת מהדוגמאות", עניתי באופן דומה:

מיכאל, אין צורך לשקוע במרה שחורה (הגם שלבלוג שלנו השפעה מכרעת על מצב הרוח). בסופו של דבר, תת-החלוקה לסוגים שונים של דו-משמעות היא כלי עבודה של העוסקים בתחום, ואך טבעי הוא שמינוח כזה או אחר יהיה מבלבל מדי עבור מי שלא מעורה בעניינים.
אולי בפוסט עתידי אנסה להבהיר את הדברים, ואולי לא. לא קריטי.

אז זה הפוסט העתידי. משפט חולצה הוא, אם לדייק, כותרת קצרה ודו-משמעית שכזו. דו-המשמעות הנוצרת היא תחבירית, אך מקורה לקסיקלי (כפל קטגוריות של מילה מסוימת). גם כזו היתה לנו כאן: גנב רכב נמלט והרג אופנוען. מיד נספר לכם על עוד אחת, אבל קודם עִזרו לנו להפריד בין שני הסוגים. כלומר, הַציעו שם למקרים התחביריים הקשים, אלה בהם אין קריאה נוספת למשפט כולו וצריך בשלב מסויים לקרוא הכל מהתחלה (כמו "כשיהודים בונים בניינים נופלים").

[ת' לסמנטיקאי הבית על שלל הערות והתעקשויות]

Read Full Post »

Older Posts »