Feeds:
רשומות
תגובות

Archive for the ‘סינית’ Category

והרי פוסט אורח מאת רן אתיה, מורה לסינית והאדם מאחורי הבלוג סימנית אחת ביום:


בוא תלמד סינית הם אמרו לי. זו שפה בלי דקדוק הם אמרו לי. מתקדמים בה ממש מהר הם הוסיפו. לא צריך לשנן כלום הם הבטיחו.

לשפה הסינית יצא שם של שפה נורא קשה ללמידה. בעיניי זה מוצדק אבל לא מהסיבות הנכונות. רוב האנשים חושבים שהאתגרים האמיתיים הם הכתב וההגייה, אבל האמת היא ששניהם לא כל כך מסובכים אם לומדים אותם בשיטתיות ובקצב המתאים. מתחת לכתב המפחיד מסתתר המון הגיון ובסוף מגלים שיותר קל להבין סינית מקריאה מאשר משמיעה.

wood

הסיבה האמיתית שהסינית כל כך קשה ללמידה מסתתרת דווקא במה שרבים תופסים כחלק הכי קל שלה – הדקדוק. על הנייר זה נשמע נהדר. אין ה"א הידיעה, אין יחיד ורבים וגם אין זכר ונקבה. אם למדתם להגיד תלמיד בסינית אז למדתם גם לומר תלמידה, תלמידים ותלמידות, וגם התלמיד, התלמידה, התלמידים והתלמידות. ממש מבצע של למדו אחד קבלו שבעה במתנה. בפעלים הדיל הזה אפילו עוד יותר משתלם כי בסינית לא רק שלא מטים את הפעלים לפי מין ומספר, גם הזמן לא בא לידי ביטוי בתוך הפועל אלא מתקיים ברכיבים אחרים במשפט. זה אומר שברגע שלמדתם את הפועל ללכת – you are good to go. אין הלכתי, הלכו, הולכות, נלך, לכו וכל השאר. בסינית גם דוברי השפה וגם עולים חדשים אומרים "אני מחר ללכת עבודה" וזה בסדר גמור.

אם נרצה לתאר את התופעה הייחודית הזו של היעדר הטיות נאמר שבסינית אין מורפולוגיה – כלומר צורת המילים אינה משתנה לפי שיטה כזו או אחרת. אבל מורפולגיה היא רק חצי מהדבר הזה שאנחנו קוראים לו דקדוק. החצי השני הוא התחביר ולכן לומר שסינית היא שפה נטולת דקדוק זה לא מדוייק. כי כשאין מורפולגיה צריך לפצות על כך ואחת הדרכים לעשות זאת היא להקשיח מאוד את חוקי התחביר. מבנה המשפט בסינית מקובע מאוד בהשוואה לעברית ולשפות אחרות. קחו למשל את המילה 'גם', בעברית אני יכול לומר "גם אני רוצה", "אני גם רוצה" או "אני רוצה גם" ואין עם זה שום בעיה. אמנם יש הבדלים דקים המשתמעים מכל משפט אבל כל הצורות תקפות. בסינית לעומת אפשר להגיד רק "אני גם רוצה" וזהו. עוד דוגמה נהדרת שממחישה כמה חשוב סדר המשפט בשפה נטולת מורפולגיה היא המשפט "לי יש" שאם נהפוך את הסדר שלו וננסה לומר "יש לי" בסינית, נקבל "יש אותי" כי בעצם הופעתה לאחר הפועל 'יש' המילה 'אני' הופכת למושא.

אבל תחביר קשיח הוא רק חצי צרה. הבעיה האמיתית בשפה ללא מורפולגיה היא שהכל נעשה, איך לומר את זה – אמורפי. מילים בשפות "נורמליות" הם כמו שולחן מאיקאה. הן מוצר סופי שעבר עיבוד והרכבה, הן מגיעות עם סט תוספות מודולריות במידה ונרצה לערוך בהן שינויים או להניח אותן במקום אחר, יש להן שכבת מגן, הוראות שימוש ואישור של מכון התקנים. מילים בסינית לעומת זאת, הן דבר הרבה יותר גולמי. לא שולחן גמור אלא יותר כמו קרש ממש גדול ורחב. הוא יכול להיות שולחן, והוא יכול להיות גם רק חלק משולחן. תשברו אתם את הראש על איך לאזן אותו.

table

אבני הבניין הבסיסיות של הכתב הסיני הן סימניות. סימניות הן לא אותיות, לא שורשים וגם לא מילים. סינית היא כל כך אמורפית עד שהן מצליחות להיות כל שלושת הדברים ביחד ואף אחד מהם בו זמנית. סימניות פשוט מבטאות משמעות. בואו ניקח למשל את הסימנית 关 שמשמעותה הבסיסית היא לסגור או לקשור. אפשר להשתמש בה כדי לומר לסגור את הדלת (关门) או לכבות את האור (关灯) ואז היא מתנהגת פחות או יותר כמו מילה העומדת בפני עצמה. אבל כאשר מצרפים אותה לסימנית 心 שמשמעותה לב מקבלים את הצירוף 关心 שפרושו הוא לא לסגור את הלב, כי שתי הסימניות האילו יוצרות ביחד מילה חדשה שפירושה אכפתיות.

רוב המילים בסינית מורכבות משתי סימניות או יותר. בדרך כלל הן מתנהגות כמו מילים רגילות אבל יש סוג אחד שפשוט לא מציית לאף חוק מוכר. אני לא יודע אם הוא קיים בשפות אחרות אבל בסינית הוא נקרא 离合词. פירוש השם הוא מילה (词) נפרדת (离) ונצמדת (合) והוא מתאר מילים שמתנהגות כמו אקורדיון. הדרך הכי טובה להבין במה מדובר היא באמצעות דוגמה אז תרשו לי להציג בפניכם את המילה 见面 שפירושה להיפגש. עכשיו תראו משהו מגניב:

meet

ראיתם מה קרה בצעד האחרון? המילה 见面 התפצלה ובתוכה מופיעות הסימנית 过 שמצביעה על כך שהפעולה התרחשה בעבר, וכן הצירוף 一次 שמשמעותו היא פעם אחת. זה קורה בגלל שהמילה להיפגש בסינית מכילה בעצמה שתי ישויות סמנטיות והן 见 שמשמעותה לראות ו-面 שמשמעותה היא פנים. כשאנחנו נפגשים עם מישהו אנחנו רואים את פניו. אם נפרק את המשפט הזה לחלקים הסמנטיים הכי קטנים שלו זה ייצא משהו כמו אני-עם-הוא-לראות-בעבר-אחת-פעם-פנים, אבל תודו שהרבה יותר נוח לתרגם את זה כנפגשתי איתו פעם אחת.

השאלה של האם אנחנו צריכים לראות מילים כגון 见面 כמילה אחת או כשתי מילים נפרדות שפשוט מופיעות בדרך כלל ביחד היא שאלה שמעסיקה חוקרי שפה רבים, וגם אנשי הוראה שתוהים איך להסביר סינית לתלמידים שלהם. השאלה שלי אליכם היא האם אתם מכירים תופעות דומות בשפות אחרות בהן מילה מסויימת יכולה לבלוע מילים אחרות בשלמותן? הדבר הכי קרוב שאני מכיר זה מוספיות תוכיות (infix) אבל לא מדובר במילים שלמות אלא באותיות והברות ללא משמעות בפני עצמן. אולי ניתן לראות את המילה 'להיפגש' בסינית כהרכב ולא כמילה עצמאית? אבל אז המבנה שלו הוא פועל-מושא והוא עדיין מתנהג באופן שונה לחלוטין מהרכבים אחרים שקיימים בסינית (למעשה רוב המילים בסינית הן הלחמים של שתי סימניות). עשר שנים של לימודי סינית למדו אותי דבר אחד וזה שהניסיון לפרק את השפה הזו לפי פרדיגמות הבלשנות המערבית נועד מראש לכישלון. וגם כשזה מצליח  זה דורש ערימות של אקרובטיקה לוגית והתוצאה שמתקבלת מעוותת ברמות. אני כבר מזמן עברתי לגישה הדאואיסטית שאומרת שלא צריך לנסות להבין ולהגדיר כל דבר, אלא פשוט להשלים עם כך שחוסר הוא חלק בלתי נפרד מן השלמות ופשוט לצעוד בנתיב. בינתיים זה עובד נהדר.

אבל ברצינות, מישהו יכול למצוא הקבלה בשפות אחרות למילה שמתנהגת באופן דומה למילה 'להיפגש' בסינית?


היה זה פוסט אורח מאת רן אתיה. רוצים גם לפרסם פוסט אורח? זה קל! השליכו דיסק-און-קי עם הפוסט בפורמט RTF מטיסה טרנס-אטלנטית עשרים דקות מערבית לאיים האזוריים, ומעבורת דגש קל תצא חיש ותאסוף אותו.

Read Full Post »

כידוע, עוד מעט הולכים לבחירות. וכידוע, הסיבה שהולכים לבחירות היא שהממשלה לא הצליחה (או לא רצתה) להעביר תקציב. אבל כשאין תקציב, אין הקצאה מתאימה לשירותים שונים.

סל התקשורת של משרד הרווחה עומד על סכום מסוים הכולל בתוכו שירותי תרגום עבור אוכלוסיית החירשים וכבדי השמיעה, סכום שנמוך משמעותית ממה שהאוכלוסיה באמת צריכה. בשנים האחרונות משרד הרווחה ומשרד התקשורת הצליחו להעביר כספים בתוך המערכת ולהגדיל את ההקצאה עבור שירותי התרגום, אבל עכשיו שאין תקציב חדש ההקצאה חוזרת למצב ההתחלתי מהעשור הקודם. במילים אחרות: קיצוץ בסל התקשורת מבלי לעשות דבר.

כך למדתי מהודעות שפורסמו לאחרונה ע"י גופים דוגמת המכון לקידום החירש ואגודת החירשים בישראל, שמתכננים הפגנה מול הקריה ביום ראשון, 30/1. במכון לקידום החירש הכינו סרטון קצר (עם כתוביות תרגום) שמסביר במה מדובר. הם מקשרים למכתב שנשלח לשר כחלון כמו גם לתשובה הלאקונית של משרד הרווחה. באגודת החירשים הכינו סרטון עם פרטים נוספים שמיועד בעיקר לאנשי הקהילה. ההפגנה מתוכננת לשעה 10:00.

תרגום משפות סימנים ולשפות סימנים הוא נושא קרוב ללבי, ואחת הרשומות שאני הכי גאה בהן באתר הזה היא הסקירה על תרגום שירים. ההתפתחויות האחרונות הזכירו לי שבעוד חבריי נאלצים להיאבק על שירותים בסיסיים, ארה"ב חוותה לא מזמן רומן עם מתורגמנית לשפת הסימנים האמריקאית (שס"א) בשם לידיה קאליס.

קאליס: 'הגרוע מכל עוד לפנינו'. מתוך הכתבה ב-The Atlantic

קאליס: 'הגרוע מכל עוד לפנינו'. מתוך הכתבה ב-The Atlantic

קאליס היתה המתורגמנית של ראש העיר ניו יורק במהלך סופת ההוריקן סנדי. עבור אמריקנים רבים זו היתה ההזדמנות הראשונה לראות מתורגמנית עובדת, וההתפעלות הגיעה לרמות מוגזמות מעט מהיכולות התיאטרליות-כביכול שלה. קחו לדוגמה את הטאמבלר (מיקרו-בלוג) שמתעד את הבעות הפנים שלה. קוראי 'דגש קל' כבר יודעים שהבעות פנים הן חלק אינטגרלי מהדקדוק של שפות סימנים ואין בהן משהו אקזוטי מדי, אבל לרוע המזל לא כולם מתורבתים ומחונכים כמו קוראי 'דגש קל'. מה שקרה הוא שנוצר גל של אהדה לקאליס, אבל מכל הסיבות הלא נכונות: גולשים היללו אותה על ה"אקספרסיביות" שלה, תושבי העיר אמרו שהיא שחקנית מעולה, אבל בשורה התחתונה כל ההתלהבות היתה לריק: לא היה שום דבר מיוחד ב"הופעה" של קאליס, היא פשוט סימנה שס"א כרגיל. הפונולוג אריק באקוביץ' כינה את התופעה language exotification, כלומר התייחסות לשפה מסוימת כאל אקזוטית ומיוחדת. הבעיה היא שכך גורמים לשפה להיראות פחות כשפה סטנדרטית ויותר כמשהו מוזר ומשונה. הנה הטור של באקוביץ'.

כשניסיתי להסביר את זה לחבריי בארה"ב, השתמשתי באנלוגיה לחיקויים של סינים שהיו נפוצים בזמנו. היום כבר אי אפשר לומר "צ'י צ'ונג צ'אן" ולהעמיד פנים שאתה סיני – זה נחשב פוגעני. הצורה שבה שס"א משתמשת בהבעות פנים "מרתקת" בדיוק באותה מידה שהצלילים של שפה כמו מנדרינית "מרתקים" או שכל העיצורים הגרוניים בעברית "מרתקים". יותר מזה, הבעות הפנים של שס"א "מרתקות" בדיוק כמו שפרוסות הבשר הרכות שאנחנו מכים אחת בשנייה כדי ליצור צלילים (מה שאנחנו מכנים "שפתיים" או "לשון") הן "מרתקות". הדבר חשוב שבעתיים עבור מיעוטים ואוכלוסיות שחוו דיכוי בעבר הלא רחוק — כמו החירשים, ולהבדיל, מהגרים מהמזרח הרחוק בארה"ב — אשר נסמכים על השפה שלהם כמאפיין מהותי בתרבותם.

שני דברים קרו כתוצאה מהעניין שקאלאס משכה, האחד מצער והאחד משמח. מצד אחד, תוכניות טלוויזיה שונות הריצו מערכונים עם דמות שחיקתה את קאלאס. לרוב היה מדובר במערכונים בטעם רע שהעליבו מסמנים רבים, גם אם הם לא התכוונו לכך. כמה היו בטעם רע במיוחד. הנה דוגמאות לשני מכתבים רהוטים שהתלוננו על מערכון גרוע במיוחד (לא אקשר אליו – מדובר בבזבוז איום של זמן).

מצד שני, שס"א זכתה להתעניינות מחודשת. מאמר מצוין מאת אקירה אוקרנט הסביר בדיוק מה קאליס עושה כשהיא מתרגמת את ראש העיר בלומברג, בלווית תמונות להמחשה. יוזמות כגון זו לתיעוד מונחים מדעיים קיבלו תשומת לב רבה יותר, וקאליס עצמה הוזמנה להדגים את הסימנים החדשים ולתרגם לשס"א את הכתבה שפורסמה בנושא בניו יורק טיימס.

לידיה קאליס היא פשוט מתורגמנית מקצוענית, חלק מתעשייה חשובה ומשגשגת. המתורגמנים בארץ לא זוכים לתשומת לב כזו, אבל זו לא סיבה להגביל את הנגישות לשירותים שלהם. עדכונים נוספים על מאבק החירשים ועל ההפגנה ביום ראשון ניתן למצוא באתרי המכון לקידום החירש ואגודת החירשים בישראל.

Read Full Post »

תקריות דיפלומטיות עשויות להיות משונות למדי. הודו זועמת על ניו זילנד לאחר שמגיש הטלוויזיה פול הנרי עשה חוכא ואיטלולא משמה של ראש ממשלת דלהי, Sheila Dikshit:

בהודו, אומה גאה, לא עברו על העניין לסדר היום ותבעו את פיטוריו של המגיש (מה גם שלהנרי היסטוריה של התבטאויות מעוררות מחלוקת, וכשאני אומר "מעוררות מחלוקת" אני מתכוון "גזעניות"). אבל מה באמת שמה של דיקסיט?

בהיעדר הקלטה בהישג יד נסתמך על הכתיב, ובהיעדר דובר הינדי בהישג יד נסתמך על ויקיפדיה (אבל שימו לב להערתו המחכימה של טל בתגובות). אם כן, בכתב הדוונאגרי המהפנט נכתב שמה של הפוליטיקאית शीला दीक्षित. האות המעניינת אותנו היא क्ष, דיגרף (תו כפול) המורכב מהתו क, שהגייתו k רגילה, ומהתו ष שעושה את כל הבלגאן. זוהי ס' כפופה (רטרופלקסית), מהסוג שקיים גם ברוסית ובמנדרינית למשל. הסימן הפונטי המקובל הוא ʂ, אך בתעתוק מדוונגארי מקובלות לרוב הצורות sh (כמו במנדרינית) או ṣ. את שם המשפחה ניתן למצוא בכמה צורות, ביניהן Diksit, Dikshit ו-Dixit.

איך זה נשמע בכלל? ככה. לאוזניים ישראליות העיצור עשוי להישמע בדיוק כמו ש' רגילה, אבל זה לא כך. בהינדי מבדילים בינו ובין श (עיצור מכתשי-חיכי שסימנו ɕ) ו-स (ס' "רגילה"). גם במנדרינית מבדילים בין שלושת העיצורים האלה (s, x, sh). אני מקווה שכשלמדתי מנדרינית לא הבכתי את עצמי בצורה דומה, אבל יכול להיות שפישלתי עם ההינדי; אנא תקנו אותי אם אתם מכירים את השפה והכתיב.

शीला दीक्षित

Read Full Post »

ויהי ערב. תם הכנס. אלה היו רשמיי:

17:50: שוב פינאלה, שוב סמנטיקה. אין, אין על סמנטיקה. סוזן רוטשטיין חולקת את רשמיה לגבי שמות עצם ספירים ובלתי-ספירים, וכאלה שהם לפעמים כך ולפעמים כך, וכאלה שההקשר מכריח אותם להיות כך ואיך יודעים שזה קורה, משפטים בהם סופרים דווקא שמות בלתי-ספירים. דוגמאות מאנגלית, עברית והולנדית, שחלקן חולק כבוד מיוחד לדר' סוס (1965). אח, סמנטיקה.

16:45: דינה אורנשטיין ויעל גרינברג מכשפות את הקהל עם ניתוח סמנטי של סתם. כבוד לנבחרת הביתית.

15:30: לביא וולף סיים את הרצאתו על "כשאת אומרת טעים למה את מתכוונת". לפי הגישה שלו לטענות כמו "העוגה טעימה", יש לדובר בראש קבוצת אנשים ממושקלת לפי חשיבות, ורף שצריך לעבור אותו כדי להיות טעים. הדעות בתוך קבוצת האנשים משתקללת לפי חשיבותם, ואם בסך הכל עברנו את הרף אז העוגה טעימה.

עכשיו מדברים אולגה קגן וסשה אלכסיינקו על הסיומת הרוסית "אוֹבָט".

בשולי הכנס: מודעה בקפה גרג לפיה הרשת "מחפשת עובדים בפריסה ארצית". דו-משמעות תחבירית, מישהו?

14:05: חזרנו מהפוגת הצהריים בשעה טעונה. גלית ששון בהרצאה עם נושא מבטיח להארד-קוריסטים שבינינו – מילים ניגודיות בלא פחות מ…אספרנטו! צלם בהיכל הגנרטיביזם.

12:25: אוון עושה לי חשק לכתוב את הפוסט הזה על אופטימליות שהבטחתי פעם.

הרצאה מדעית נקייה. תענוג.

אוון במילות סיכום: אין ספק שבמילים הטבעיות לעברית אין תופעה של הרמוניה. אין ספק שבמילים שעברית שואלת משפות זרות יש הרמוניה. אז אפשר לומר שהרמוניית תנועות היא תופעה אוניברסלית, שמופיעה רק בפריפריה של השפה (כלומר במקומות שבהם הצלילים נושאים פחות מידע). עוד סימוכין לכך – טורקית, שפה שנודעת בהרמוניה התנועתית שלה (ר' אריק אינשטיין בכבלים, 1990), מהרמנת לחלוטין רק את המוספיות שלה. רוב המילים הבסיסיות דווקא כן כוללות מגוון של תנועות.

12:00: ההרצאה של שירה פרבי (אֶת אָל) על קבילות ביטויים חוזרים בעברית כוללת תוצאות קצת מפתיעות: מניפולציות על סיבוכיות המשפט (כמו להכניס את הביטוי החוזר לתוך עוד משפט משועבד) לא משפרת את המידה שבה הכינוי החוזר מתקבל לעומת המשפט המקביל ללא הכינוי החוזר. כדי לסבר את האוזן, אנחנו מדברים על השיפוט של דברים כמו דינה מסכימה לפגוש את הצלמת שטל סיפר שדן פגש (אותה) בחיפה.

אבחנה מרתקת תורנית: כל התמסירים (handouts) עד כה היו בעלי מספר עמודים זוגי. כולל זה של ההרצאה הקרובה – אוון גרי כהן באתנחתא פונטית/פונולוגית, הרמוניית תנועות בשאילת מילים לעברית (או: למה לעזאזל אנחנו אומרים קנגוּרו?)

11:20: נזכרתי בדבר: אתמול חשבנו שוב על בעיית המשגת משפטי העיבוד הסבוכים, אז הרי הרעיון שלי: Garden Path הוא משעול, ונדמה שמקור המשפטים האלה בגיהנום. לכן, מִשׁאוֹל (מחשב אמיתי אולי, אבל הכפתור של השווא לא עובד. עמכם הסליחה).

אם כן, משאול. דונו.

10:45: דוגמה מעניינת אצל בלטי: מבנה תחבירי שמפורסם במסובכותו הוא פסוקית זיקת מושא (דיברנו על זה בדגש, לא מוצא כרגע): הפיל שהג'ירפה רוחצת (זו לא בדיוק הדוגמה שלה, שמתכתבת קצת עם crash blossoms אגב) נחשב ביטוי קשה לעיבוד. מה עושים? מסבכים אותו עוד יותר על-ידי הוספת סביל, ואז מתקבל ביטוי קל יותר לעיבוד… הפיל שנרחץ על-ידי הג'ירפה. בלטי מסבירה שכעת התפקידים של הפיל נשארים "מקובצים" ביחד ואין את הג'ירפה שמפריעה למהלך העניינים הלינארי.

רגע, מה עם הפיל שהג'ירפה רוחצת אותו? על ביטויים חוזרים בעברית, בהרצאה הבאה.

ומה יהיה עם כל הגופן בולט שלי? לפחות לי אין פטיש סימני קריאה.

שעה שמחה (10:10): ברוכים הבאים ליום השני של כנס האגודה הישראלית לבלשנות תיאורטית. היום בולג עבדכם הנאמן, ואפילו ממחשב אמיתי. לפני שאקדיש מלוא תשומת לבי להרצאתה של אדריאנה בלטי על גזירות מורכבות, מילה של נזיפה: בלשנים חישוביים! איפה אתם? הנה כנס חשוב מתחת לאפכם ממש, ואתם אינכם בנמצא. נא לתקן לקראת יאטל 27.

———————————————–

קישור לאתמול

Read Full Post »

חוקר התרגום איגנסיו גרסיה מאוניברסיטת מערב סידני הוא מאמין גדול בתרגום מכונה, והוא החליט לבדוק האם מערכות תרגום אוטומטיות יכולות לסייע למתרגמים בשר-ודם. במחקר שהתפרסם לא מזמן הוא נתן למספר סטודנטים לעבוד על טקסטים באנגלית ולתרגם אותם לסינית. עבור חצי מהטקסטים השתמשו המתרגמים בתרגום אוטומטי של גוגל כבסיס, והתוצאות היו – אולי במפתיע – טובות.

המשתתפים קיבלו ארבעה טקסטים, שניים בנושאי משפט ושניים בנושאי רפואה (יותר ברמת ויקיפדיה מאשר ברמת כתב עת מקצועי, אם לשפוט מהדוגמאות במאמר), עם גיוון מתבקש בסדר הצגת הטקסטים בין המשתתפים השונים. לא הותר שימוש במילונים, מרשתות ועזרים דומים. בשני טקסטים הופיע תרגום המכונה של גוגל בתור הטקסט המתורגם, ואותו שינו המתרגמים; בטקסטים האחרים, טקסט היעד היה זהה בתחילת העבודה לטקסט המקור. גרסיה ביקש לבדוק שני דברים: האם יש הבדל באיכות, והאם יש הבדל במהירות.

לגבי המהירות, 15 מתוך 28 הנבדקים עבדו מהר יותר עם עזרה של תרגום מכונה, כלומר בקושי יותר מחצי. גם בין המשתתפים ובין עצמם היה קשה לזהות נטיות: רבים מהסטודנטים עבדו מהר יותר עם תרגום מכונה על טקסט אחד אבל לאט יותר על טקסט אחר; וכמעט כולם עבדו לאט יותר על המטלה הראשונה, לא משנה מה היתה (תחושה שוודאי מוכרת למתרגמים רבים).

בעניין האיכות אפשר כבר לזהות מגמה: מתוך 56 תרגומים, 33 תרגומים מתרגום מכונה נוקדו על ידי בוחנים חיצוניים כטובים יותר. ציונים ממוצעים (מתוך 50) לתרגומים היו 33.8 עבור התרגום הסטנדרטי ו-36.4 עבור תרגום עם בסיס של תרגום מכונה (הציונים נעו בגדול בין 30 ל-40). שבעה משתתפים ניפקו תוצר טוב יותר עם בסיס של תרגום מכונה ושניים סיפקו תוצר גרוע יותר.

המשתתפים בניסוי רואיינו בתחילתו ובסופו לגבי העדפותיהם, וניתן היה להתרשם שהם חשבו שתרגום המכונה הוא רעיון טוב, במיוחד לאחר שניתנה להם הזדמנות להשתמש בו. בין הערות הסיום שלו, גרסיה גם מעלה את האפשרות שלחלק מהסטודנטים עשוי להיות ניסיון קודם בעריכת תרגומי מכונה, "בניגוד להמלצות המרצים שלהם". הבה נצא במחול ונרקוד את תרגום המכונה.

Ignacio Garcia (2010). Is machine translation ready yet? Target 22:1, 7–21.

Read Full Post »

(וגם בלִבּי, כמובן)

שיזף רפאלי, ראש ביה"ס לניהול באוניברסיטת חיפה, חיבר מאמר קצר עבור "כלכליסט" (האם ה-SMS מעצב מחדש את מוחותינו?, 18/2/2010) בו הוא מספר על מספר ניסויים שערכה לרה בורודיצקי ומשמעותם לגבי הקשר שבין שפה ומחשבה, נושא בו הספקנו לעסוק לא מעט. הבעיה היא שרפאלי עשה מיש-מש קל מכמה דברים, פירש לא נכון מספר ניסויים ותיבל עם כמה שטויות גמורות. איזה מין שטויות? אתן לכם רמז: הן מתחרזות עם "לאסקימואים יש מאה מילים לפלג". אבל מילא בורות בעניינים בלשניים, לזה אנחנו רגילים; כותרת הכתבה וכותרת-המשנה מבטיחות גדולות ונצורות לגבי ההשפעה של מסרונים על הדרך בה אנחנו חושבים, נושא שלא נידון בכתבה בכלל. כנראה שהשילוב בין אי-התעמקות מספקת בטקסט ובין עורכים יצירתיים עד כדי סילוף בכלכליסט היכה שוב. לכן, דסק אימות הנתונים של "דגש קל" חבר פעם נוספת לחטיבת החינוך והאינדוקטרינציה על מנת לעשות סדר במאמר של פרופ' רפאלי – בימים כתיקונם מישהו שאנחנו דווקא מעריכים – ולפרט מה אנחנו באמת יודעים לגבי שפה אנושית, מה לא, ומה ממש אבל ממש לא (רמז: זה קשור לקוטב הצפוני).

זה פוסט קצת ארוך, אז אפשר בהחלט לדלג לחלק שיעניין אתכם יותר: ב"המקור" אזכיר על מה מבוסס הטור של רפאלי. תחת "תיקונים" נכנסות כל ההכללות השגויות שהופיעו בכתבה. בחלק שנקרא "מחקרים" אני סוקר את הניסויים שבורודיצקי באמת ערכה ומה הם באמת אומרים, ואז בא סיכום ונו-נו-נו ל"כלכליסט".

המקור

עושה רושם שהמקור לטור של רפאלי הוא פרק של בורודיצקי בספר What's Next שיצא לא מזמן. את המאמר של בורודיצקי (שכתוב בצורה נגישה מאוד, ובעניין חיבתה של בורודיצקי למדע פופולרי אספר אנקדוטה נחמדה בסוף הרשומה) אפשר למצוא במלואו כאן באתר Edge. זו ההפנייה הביבליוגרפית עבור מי מכם שהתעניין לדעת על מה מתבסס הטור של רפאלי. על חלק מהמחקרים של בורודיצקי דיברנו כאן בעבר: זמנים ומין דקדוקי.

תיקונים

שלג וגמלים

בואו נתחיל:

וכבר גילו שלאסקימואים יש יותר מילים נרדפות לשלג ולערבים לגמלים,

קודם כל: אז מה? ועכשיו לעובדות.
לגבי הסנובון של השלג: לא נכון, כפי שהסברנו לא פעם (וראו אצל בן לי).
לגבי הגמלים: לא נכון. הנה טור מצוין של הבלשן ג'פרי פולום מאוניברסיטת אדינבורו בנושא (קריאה מומלצת מאוד!) והנה דעתו של לאמין סואג, דוקטורנט מבריק לבלשנות ממוצא אלג'יראי. העיקרון הוא כזה: גם אם לערבים היו ארבעים מילים לגמלים (ואין להם), זה עדיין לא אומר שום דבר על תפישתם את המציאות, או על איך שהמוח שלהם עובד, או שום דבר בסגנון. זה רק אומר שערבים שעובדים בתור מגדלי גמלים יודעים יותר על גמלים, ותסכימו איתי שזו לא תגלית גדולה במיוחד. גם זה שבחברות מערביות ניתן להבדיל בין תריסרי סוגי כלבים לא אומר שכל תפישת העולם שלנו מושפעת ממושג הכלביוּת. ובמילים אחרות: הבדלים תרבותיים אינם משתקפים בהכרח בגודל אוצר המילים, וגודל אוצר המילים אין משמעו בהכרח הבדל תרבותי, ואין לערבים 40 מילים לגמל (אבל בסומאלית, אם מתאמצים מאוד, אפשר למצוא).

סינית

שבעברית הדיבור ישיר יותר ובסינית הוא מתבסס יותר על טון הדיבור.

בעברית הדיבור ישיר יותר מאשר… איפה? בסינית? איך מגדירים ישירוּת של דיבור?
בסינית הדיבור לא "מתבסס" על הטון יותר מאשר שבעברית הוא "מתבסס" על החיך או על הלשון. סינית (הכוונה לכל השפות הסיניות, כי אין באמת דבר כזה "סינית") היא אכן שפה טונאלית: כשאומרים צירוף הברות מסוים, יש הבדל בין להגיד אותו בטון גבוה ובין להגיד אותו בטון נמוך, כי מתקבלת מילה שונה. זה עניין לקסיקלי גרידא, כלומר הוא נוגע רק להרכב המילים. מהבחינה הזו, הוא דומה להבדל בין "חיבל" ו-"חיבר" בעברית (מה שנקרא זוג מינימלי, מושג שהזכרנו בעבר), הבדל שלא קיים בסינית כי בפונולוגיה הסינית אין הבדל בין ר' ובין ל'. ככה שלהגיד שהדיבור בסינית מתבסס על הטון זה מטעה, משום שזה כמו להגיד שהדיבור בעברית מתבסס על הפרדה בין ל' ובין ר': יש שפות שעושות את זה ויש שפות שלא, אבל עוד לא הוכח הקשר תרבותי.

ילידי אוסטרליה

למשל, בשפתם המקומית של ילידי אוסטרליה

להגיד "ילידי אוסטרליה" זה כמו להגיד "ילידי אירופה". באוסטרליה היו כמה מאות שפות לפני שהגיע האדם הלבן וגם היום שרדו כמה תריסרים. הכוונה של רפאלי היא לשפת קואוק תאיורה (Kuuk Thaayorre) של בני הפוּמפוּרָאוּ. בורודיצקי עצמה (בורודיצקי 2003) ויובל שלנו (פינטר 2010, תכתובת פרטית) גילו את עיניי והעירו שגם בשפת צלטאל (Tzeltal) יש תופעה דומה. בכלל, בורודיצקי 2003 הוא עוד סקירה נחמדה של הנושאים עליהם אנחנו מדברים כאן. ראו גם את (לי וגלייטמן 2002) לדעה הפוכה על צלטאל.

מחקרים ופרשנות

שושנת הרוחות

אין מושגים המקבילים ל"צד ימין" "שמאל" "לפנים" ו"לאחור". התייחסותם למרחב היא רק תוך שימוש בשמות רוחות השמים. אפילו היד שאנחנו מכנים "יד שמאל" מכונה אצלם "היד שבצפון־מזרח".  בורודיצקי מקשרת זאת ישירות לכושר ההתמצאות יוצא הדופן של ילידי אוסטרליה, ל"מצפן הפנימי" שרומנטיקנים רבים מייחסים להם.

זה באמת עניין פנטסטי, אבל רפאלי הופך סיבה ומסובב. בורודיצקי לא טוענת שהשימוש ברוחות השמיים נובע מכושר התמצאות יוצא דופן. ההיפך הוא הנכון! מגיל אפס דוברי קואוק תאיורה רגילים לתאר את העולם במושגים של מזרח-מערב, ולכן הם מטפחים את כושר ההתמצאות שלהם. היא כותבת במפורש: "מה שמאפשר להם – למעשה, מה שמכריח אותם – לעשות את זה הוא השפה שלהם". זה נושא מעניין, כמו כל הנושאים בהם בורודיצקי עוסקת, אבל אין כאן שום הוכחה שלילידי אוסטרליה יש "מצפן פנימי" שמשפיע על איך שהם מעבדים את העולם. אדרבה, זה רק מראה עד כמה הם דומים לאנשים בשאר העולם.

במבחני תפיסה והבנת הנקרא הילידים הללו הצטיינו בפענוח של דברים מרחביים, אך התקשו בשאלות שדרשו מהם לבחון דברים זה ביחס לזה, או לבצע הקשרים סדרתיים.

כאן אני מוכרח להודות שאני לא יודע מאיפה הטענה הזו מגיעה. לא זכורות לי מסקנות כאלה מהעבודה הנרחבת של אליס גבי מאוניברסיטת ברקלי על קואוק תאיורה (הרבה מאמרים כאלה) או מהניסויים של בורודיצקי; למעשה, גבי מפרטת לאורך 28 עמודים את הדרכים השונות בהן דוברי קואוק תאיורה יכולים לבחון בשפתם דברים זה ביחס לזה (גבי 2008), ובורודצקי מצאה שכמו שאנחנו מתארים את הזמן מימין לשמאל ודוברי אנגלית משמאל לימין, דוברי קואוק תאיורה מתארים אותו ממזרח למערב.
אבל תמיד יכול להיות שרפאלי למד על כמה ניסויים שאני לא שמעתי עליהם. אשמח לקבל תיקונים והארות.

כחול בהיר וכחול כהה

ברוסית, למשל, אין שם כולל לצבע הכחול. לכחול העמוק יש מילה שמייצגת אותו, ולתכלת מילה אחרת לגמרי. והתוצאה: במבחני ראייה, רוסים הבחינו טוב יותר בהבדלים בין גוונים שונים של כחול. זהו קשר ישיר בין השפה לתפיסה.

זה באמת היה ניסוי מעניין מאוד (וינאוור, בורודיצקי ואחרים 2007), אבל צריך לדייק. הנה תמונה מתוך המאמר: למעלה שורת גוונים שנופלים תחת ההגדרה "כחול". באמצע אחד הצבעים שהוצגו למשתתפים בניסוי, ולמטה שני הצבעים שאחד מהם זהה לצבע באמצע. המשתתפים התבקשו להגיד איזה משני הצבעים התחתונים זהה לצבע באמצע, במספר מצבים שונים.

כאמור, הניסוי בוצע במספר שלבים.

  1. המשתתף קיבל שלשות רבות של ריבועים כפי שתואר לעיל, כשכל ריבוע הוא באחד מעשרים הגוונים השונים של כחול שניתן לראות למעלה. לפעמים שני הריבועים התחתונים היו כהים, לפעמים שניהם היו בהירים ולפעמים אחד היה כזה ואחד היה כזה. ההנחה היתה שדוברי רוסית יבדילו טוב יותר מדוברי האנגלית בין ריבועים ברמות כהות שונות, בעוד אצל דוברי האנגלית גוון הריבועים לא יהווה גורם כשיחליטו איזה ריבוע דומה לאיזה.
  2. כמו (1), רק שהמשתתף ביצע פעולה מילולית במקביל על מנת להקשות על המחשבה (נסו למשל לספור בקול רם מאחד עד מאה בזמן שאתם קוראים את הפוסט הזה).
  3. כמו (2), רק עם פעולה מרחבית במקום מילולית.

דוברי רוסית היו איטיים יותר באופן כללי, אבל מהירים יותר בתגובתם כשהיו צריכים להבחין בין גוונים מסוגים שונים (בהיר/כהה) מאשר כשהיו צריכים להבחין בין גוונים מאותו סוג. אצל דוברי האנגלית לא היה הבדל כזה.

בנוסף לכך, כשדוברי רוסית היו צריכים להבדיל בין גוונים דומים במהלך ביצוע מסיח מילולי, היה להם קשה הרבה יותר מאשר במשימות האחרות שהוטלו עליהם. אצל דוברי האנגלית לא היה הבדל של ממש.
חוץ מזה, יש עוד פיתול אחרון בעלילה: לדוברי הרוסית היה קל יותר (באופן יחסי לשאר המשימות) להבדיל בין גוונים שונים מאותו הסוג, כאשר הם לא ביצעו מסיח אחר.

אז מדע זה עניין מסובך וטרחני (כל אחד מהמשתתפים עבר יותר מ-130 שלשות של ריבועים כחולים!), וכשניסויים מתוכננים ומבוצעים כהלכה הם יכולים להיות מורכבים משהו, אבל בכל זאת, להגיד "רוסים הבחינו טוב יותר בגוונים של כחול" זה לא מדויק.

אמנות

פרופ' בורודיצקי נכנסה גם למוזיאונים ובדקה כיצד אמנים מתרבויות שונות ציירו מושגים מופשטים כגון "זמן", "ניצחון", "חטא", או "מוות". ב־85% מהמקרים, מינה של הדמות שייצגה את המושג – וכנגזר מכך הסטריאוטיפים של אופייה – תאמו את מינה בשפת האם של הצייר. בציורי הגרמנים המוות היה גבר הרסני, אצל הרוסים – אשה מסתורית.

לא הספקתי למצוא את המאמר המדובר – גם לי קשה לפעמים לשרוד את כל הפוסט של עצמי. רק אומר שכשדיברתי עם אוצרת היא אמרה לי שלדעתה זה דבר מאוד נכון. מה שיפה הוא שהיא אמרה לי את זה כהערת אגב לפני שבכלל הזכרתי את הניסוי הזה, כשדיברנו על הניסוי עם המפתח והגשר.

כותרות

אני בוחר להאמין שפרופ' רפאלי הגיש ל"כלכליסט" כתבה מפורטת יותר, אבל עורכיו חתכו בבשר החי והותירו את ערימת הטלאים שפורסמה. כך או כך, נביא שוב את כותרת המשנה:

ניסויים גילו: מבנה השפה ואוצר המילים שמכתיבה תרבות ה-SMS משפיעים על התפיסה והמחשבות

היי, יש לי כותרת משנה טובה יותר:

ניסויים גילו: מבנה השפה ואוצר המילים שמכתיבה תרבות העריכה ב"כלכליסט" משפיעים על תפיסת העיתונות כאמינה

בננה

אך נסיים בנימה חיובית ושמחה. לאחרונה התחוור לי שעוד לא הסברתי למה אני כל כך מחבב את בורודיצקי (החברים שלי מכירים אותי לא רע – תמונה שלה הופיעה על ברכה ליומולדת שקיבלתי בשנה שעברה). אז אם להיות רצינים, החיבה שלי לבורודיצקי, אותה מעולם לא פגשתי, לא נובעת רק מזה שהמחקר שלה מרתק; מה שעוד חשוב הוא שהיא נהנית להסביר אותו לקהל הרחב ושהיא נוהגת להתחפש לבננה.

כשאני אומר "מסבירה לקהל הרחב", אני מתכוון שהיא מתראיינת לרדיו ולעיתונאים וכותבת מאמרי מדע פופולרי. כשהיא מעבירה הרצאות בבאר אפלולי בסן פרנסיסקו, מדובר בלהיט.

כשאני אומר "בננה" אני מתכוון שיש לה חליפת-בננה והיא אף בנתה אוהל-בננה. וכך צריכים להתנהג פרופסורים לפסיכולוגיה!

Peggy Li, Lila Gleitman (2002). Turning the tables: language and spatial reasoning, Cognition 83(3):265–294
Lera Boroditsky (2003). Linguistic Relativity. In Nadel, L. (Ed.), Encyclopedia of Cognitive Science: 917–921. MacMillan Press: London, UK.
Alice Gaby (2008). Distinguishing reciprocals from reflexives in Kuuk Thaayorre. In Ekkehard König and Volker Gast (Eds.), Reciprocals and Reflexives: 259-288. Mouton de Gruyter: Berlin, New York.
Winawer, J., Witthoft, N., Frank, M., Wu, L., Wade, A., and Boroditsky, L. (2007). Russian blues reveal effects of language on color discrimination. PNAS. April 30, 2007

Read Full Post »

מזל טוב לסין, שעשוייה לזכות במספר שפות חדשות. החוקר ימין פלקי "ואשתו" (השם שלה כנראה לא חשוב) בילו זמן מה במחוז יונאן שעל גבול סין-ויטנאם ואספו מידע על איך שהמקומיים מדברים. לטענת פלקי, בשטח מצומצם יחסית אפשר למצוא כמה וכמה שפות שונות, דבר שנובע בעיקר מתנאי השטח באיזור שמגבילים את התנועה.

מיכאל ארארד כתב על הממצאים שלהם בלשון שווה לכל נפש עבור כתב העת Science, ולמי שאין גישה אליו יש אפשרות למצוא את הכתבה מינוס התמונות באתר האישי של הכותב (דרך אגב, לארארד יש תואר שני בבלשנות וזה ניכר בזה שהוא כותב מעט מאוד בולשיט). חלק ניכר מהכתבה מתייחס לסוגיה הבאה: האם אלה שפות שונות או רק דיאלקטים של אותה שפה. פלקי, מחד, טוען שאלה שפות שונות. הוא מתבסס על העיקרון של mutual intelligibility (איך אומרים את זה בעברית? הבנה הדדית?), כלומר האם שני דוברים יכולים להבין אחד את השני אם כל אחד מדבר בשפתו-הוא. אליבא דפלקי, בגלל שיושבי כפר אחד לא יכולים להבין את יושבי הכפר האחר, מדובר בשפות שונות.

צריך להיזהר ממסקנות כאלה משני טעמים: ראשית, זו שיטה יעילה וחשובה אבל לא מדעית לחלוטין. ישנם דוברי גרמנית שלא יכולים להבין אחד את השני בגלל שהם דוברים דיאלקטים שונים, אבל אחרי חמש דקות של שיחה הם כבר יתרגלו זה לזאת וימצאו שפה משותפת. שנית, לעיתים יש לחוקרי שפות "אקזוטיות" נטייה לראות אותן בתור יותר אקזוטיות ממה שהן באמת. כך למשל דן אוורט, שחקר את הפיראהא ושפתם, כנראה הגזים קצת עם תיאוריו.

מה שמסבך את החיים הוא שמי שממליצים להשתמש בשיטות "מדעיות" יותר על מנת להשוות בין הניבים השונים הם מדענים סיניים, כשמבחינת המשטר הסיני, עדיף שלכמה שפחות מיעוטים אתניים יהיו שפות משלהם. הפן הפוליטי בשאלה "שפה עצמאית או דיאלקט" תופס חלק נכבד מהסיפור ונראה שאף צד לא חף משיקולים זרים.

[דרך מעבדת השפה והקוגניציה, בלוג נגיש למדי של דוקטורנט לקוגניציה באונ' הרווארד]
Michael Erard (2009). How Many Languages? Linguists Discover New Tongues in China. Science 324(5925): 332–333

Read Full Post »

Older Posts »