Feeds:
פוסטים
תגובות

Archive for the ‘אנגלית’ Category

מזה מספר חודשים שאחת הפרשות הבולטות בתקשורת הישראלית היא פרשת האונס (או החשד לאונס) בעיר איה נאפה שבקפריסין. מה שכמעט ולא היה חלק מהשיח הציבורי סביב הפרשה הוא עדות בלשנית שהוגשה לאחרונה במסגרת המשפט שהתנהל נגד הצעירה, משפט שזה עתה הסתיים עם הרשעה ועונש מאסר על תנאי. אם לקצר את עיקרי הפרשה, מדובר באירוע מהקיץ האחרון בו צעירה מבריטניה קיימה יחסי מין עם קבוצה של צעירים ישראלים במהלך חופשת קיץ בקפריסין. השאלה הקריטית היא האם יחסי המין היו בהסכמה או לא. הצעירה טענה שמדובר באונס אך אחר כך הואשמה שטפלה על הצעירים האשמת שווא. היא הגישה כתב הודאה והפכה לנאשמת. השופט הקפריסאי פסק לפני ימים ספורים כי אכן מדובר בהאשמת שווא והרשיע את המתלוננת. עוד פרטים ניתן למצוא למשל בערך בוויקיפדיה ובמראי המקום הרבים שם.

ברשומה הזו אני רוצה לסכם את הדו"ח הבלשני שהגיש עד מומחה מטעם ההגנה (על הצעירה), ד"ר אנדראה ניני מאוניברסיטת מנצ'סטר. סלע המחלוקת בהודאתה לכאורה של הנאשמת נמצא בשאלה האם היא הודתה בהגשת תלונת שווא מרצונה החופשי או שנוסח ההודאה הוכתב לה על ידי המשטרה הקפריסאית, כפי שהנאשמת טוענת כעת. ד"ר ניני, מומחה לבלשנות משפטית (פורנזית), קיבל לידיו את כתב ההודאה והתבקש לקבוע האם סביר שהוא נכתב על ידי מישהי עם פרופיל כמו זה של הנאשמת: בריטית בת 19 שעומדת להתחיל את לימודיה באוניברסיטה. השורה התחתונה של הדו"ח היא לא: לא סביר שהנאשמת ניסחה את ההודאה בעצמה.

עם כל הסיקור הנרחב בתקשורת הישראלית, אני לא זוכר שראיתי אזכור של העדות הזו באף כתבה בעברית מלבד בכתבה הזו בוואלה!, ונכון לזמן עליית הרשומה הזו גם אין אזכור לעדות בערך על הפרשה בוויקיפדיה. לכן ביקשתי מניני את הדו"ח וקיבלתי את רשותו לסכם את הממצאים כאן בעברית (מיותר לציין כי ניני עצמו לא נושא באחריות לרשומה הזו). כמה כתבות באנגלית המכילות את עיקרי הניתוח הבלשני ניתן למצוא כאן, כאן וכאן, וקטע מראיון טלוויזיוני כאן.

שיטה

נתחיל עם הטקסט עצמו. מדובר בפסקה העיקרית מכתב הודאה קצר מאוד, שזה נוסחה:

The report I did on the 17th of July 2019 that I was raped at ayia napa was not the truth. The truth is that I wasnt raped and everything that happened in that appartment was with my consent. The reason I made the statement with the fake report is because I did not know they were recording & humiliating me that night I discovered them recording me doing sexual intercourse and I felt embarrassed so I want to appologise, say I made a mistake.

ישנם לא מעט חלקים בפסקה הזו שצורמים לעין או לאוזן, למשל אי-השימוש בסימני פיסוק או שגיאות כתיב דוגמת appartment או appologise. עושה רושם שכתבתו של יואב איתיאל בוואלה! ניסתה לתרגם את כתב ההודאה מאנגלית מסורבלת לעברית מסורבלת:

"הדוח שעשיתי ב -17 ביולי 2019 שנאנסתי באיה נאפה לא היה האמת. האמת היא שלא נאנסתי וכל מה שקרה בדירה הזו היה בהסכמתי", נכתב בהצהרה שחתמה הצעירה בתחנת המשטרה. "הסיבה שנתתי הצהרה עם דיווח פייק נובע מכיוון שלא ידעתי שהם מקליטים ומשפילים אותי באותו הלילה גיליתי שהם מקליטים אותי עושה משגל מיני והרגשתי נבוכה כפי שאני רוצה להתנצל, ואני אומרת שעשיתי טעות".

הרשומה הזו מתמקדת במחקר של ד"ר ניני כפי שהוגש לבית המשפט. ניני נתבקש לחוות דעתו ולקבוע – במידת הניתן – האם הנאשמת חיברה את כתב ההודאה בעצמה או שהנוסח הוכתב לה על ידי מישהו שאינו דובר ילידי. בשביל לענות על השאלה הזו הוא זיהה חמישה מבנים תחביריים או צירופים יוצאי דופן וניסה לשער מהי הסבירות שדובר ילידי ישתמש בהם. על מנת לאמוד את הסבירות הזו הוא נקט בשיטה נפוצה למדי והיא בדיקת שכיחויות באוספי טקסט גדולים מאוד (קורפוסים) שמאפשרים חיפושים כלליים מאוד. כך למשל, אפשר לספור ולמצוא שהמילה כלב מופיעה הרבה יותר באוסף טקסט בעברית מאשר המילה קאק. עובדה זו מרשה לנו להניח שאם מישהו השתמש במילה קאק הרבה, הם כנראה מומחים לתחום או עוסקים בזואולוגיה. בימינו אפשר גם לבדוק מבנים תחביריים מורכבים יותר. למשל, אפשר לבדוק באמצעות פקודה אחת את כל הטיות הפועל כתב בצירוף כמו כתבתי/כתבת/כתבנו/אכתוב/… את המספר ולהשוות אותן להטיות הפועל רשםרשמתי/רשמת/רשמנו/ארשום… את המספר. כך אפשר לראות האם אנשים משתמשים בשורש כ.ת.ב או בשורש ר.ש.מ יותר, והאם חל שינוי לאורך זמן.

בחזרה למקרה שלפנינו, בכל אחד מהקורפוסים שבהם השתמש ניני היו 8.5 מיליארד מילים בממוצע, והם כיסו סוגות ספרותיות שונות (עיתונות, פרוזה, טקסטים משפטיים) כמו גם מקורות גיאוגרפיים שונים (דוברים אמריקאים או בריטים).

אלה חמשת המבנים התחביריים שניני בדק, עם תרגום חופשי שלי. אותיות גדולות מורות על כך שכל ההטיות השונות של המילה נבדקו, כך ש-REPORT מכיל גם את צורת היחיד report וגם את צורת הרבים reports.

  1. DO REPORT – לעשות דו"ח
  2. BE not the truth – לא האמת
  3. apartment – דירה
  4. DISCOVER NOUN VERB-ing – לגלות שם-עצם עושה פועל מסוים
  5. DO sexual intercourse – לעשות יחסי מין

בואו נראה מה היו הממצאים עבור כל צירוף ברשימה. בכל אחד מהמקרים הגיע ניני לאותה המסקנה: הסבירות גבוהה יותר שמדובר בניסוח של דובר לא-ילידי מאשר של הנאשמת עצמה.

ממצאים

לעשות דו"ח

באנגלית טבעית אומרים write a report או make a report, ולא do a report כמו בכתב ההודאה. כשמשווים בין הגירסה עם do והגירסה עם make, עולה כי הגירסה עם make נפוצה פי 3. במילים אחרות, אם דובר צריך לבחור אחת מהשתיים, הוא יבחר בגירסה עם make בערך 75% מהזמן.

בנוסף, בקורפוס המשפטי הגירסה עם do לא מופיעה בכלל. ניני מציין גם שבגלל טבע החיפוש הטקסטואלי, מחרוזת החיפוש עבור DO REPORT מצאה גם צירופים שאינם קשורים כמו בשאלה does the report say, כך שהשכיחות האמיתית של הגירסה עם do נמוכה עוד פחות ממה שהעלה החיפוש הראשוני.

לא האמת

באנגלית טבעית אומרים not true, ולא not the truth כמו בכתב ההודאה. כשמשווים בין שתי הגירסאות ניתן למצוא העדפה גורפת לגירסה לה קראתי "טבעית": בערך 98% מהזמן. זוהי גם הגירסה היחידה שמופיעה בקורפוס המשפטי.

דירה

המילה apartment אופיינית יותר לאנגלית אמריקאית, ואילו באנגלית בריטית נהוג לומר flat. כאן ההבדל בין הקורפוסים השונים מכיל את התימוכין: בקורפוסים הבריטים המילה flat שכיחה מעט יותר (בערך 60% מהזמן), ואילו בקורפוסים האמריקאים כמעט ולא משתמשים בה (רק 15% מהזמן אל מול 85% עבור apartment).

שאלתי את ד"ר ניני האם הסיפור כאן לא יותר מסובך, משום שבקפריסין נהוג ללמד אנגלית בריטית. הוא מסכים עם הקביעה שהמאפיין הזה פחות חד-משמעי מאשר האחרים שהוא בדק, אבל הסביר שלמען העקביות הוא רצה לבחון את כל המאפיינים שאינם טיפוסיים לכותב עם רקע לשוני כמו זה של הנאשמת. אני חושב שהשימוש הנרחב יחסית בצירוף apartment hotel (מלון דירות) בעיר נופש כמו איה נאפה עשוי להשפיע יותר על מי שגר שם מאשר על מי שרגילה לומר flat כל חייה, אבל כאמור, כאן ההבדלים בולטים מעט פחות.

לגלות

הצירוף הזה מסובך מעט יותר. הנה שוב החלק הרלוונטי מכתב ההודאה (עם הדגשה שלי):

The reason I made the statement with the fake report is because I did not know they were recording & humiliating me that night I discovered them recording me doing sexual intercourse and I felt embarrassed

אני מוכרח להודות שהתקשיתי להבין מה הייתה הכוונה עד שקראתי את הדו"ח של ניני. אם לנסח מחדש, כתב ההודאה היה אמור להגיד משהו כמו "גיליתי שהם הקליטו אותי", או בתרגום שלי בחזרה לאנגלית:

The reason I made the statement with the fake report is because I did not know they were recording & humiliating me that night. I discovered that they recorded me doing sexual intercourse and I felt embarrassed.

הקריאה הזו אופיינית לצירוף discover that ולא לצירוף הראשון. את הצירוף הראשון, שהופיע בכתב ההודאה, ניתן אולי לתרגם "גיליתי אותם מקליטים אותי". אך לא זו הייתה אמורה להיות הכוונה. אי ההבחנה בין שתי הצורות אינו אופייני לדובר ילידי של אנגלית.

לעשות יחסי מין

באנגלית טבעית אומרים have sexual intercourse, ולא do sexual intercourse כמו בכתב ההודאה. כשמשווים בין שתי הגירסאות ניתן למצוא העדפה גורפת לגירסה לה קראתי "טבעית": זוהי הגירסה שמופיעה מעל 99% מהזמן. זוהי גם הגירסה היחידה שמופיעה בקורפוס המשפטי.

סיכום

בכל אחד מחמשת המבנים התחביריים ניתן להראות שהנוסח לא מתאים לדוברת ילידית של אנגלית בריטית. הממצאים האלה עולים בקנה אחד עם הטענה לפיה נוסח ההודאה הוכתב לנאשמת ולא הגיע מיוזמתה. ניני המליץ בסוף הדו"ח לאסוף תכתובות נוספות באנגלית, הן של הנאשמת והן של השוטר שחקר אותה, על מנת לערוך השוואות מובהקות יותר בין כתב ההודאה לבין סגנון הכתיבה של השניים. המלצה זו לא אומצה. איזה משקל יש לתת לדו"ח כזה – זו כבר שאלה עבור מערכת המשפט, לא עבור בלשנים. השופט בתיק לא השתכנע מהדו"ח (וגם לא מהדו"ח הפסיכולוגי שהוגש), לא ציטט הסברים אלטרנטיביים לממצאים ופסק נגד הצעירה.

Read Full Post »

כך תעשה

ככל שעוברות עלי יותר שנים בחשיפה לעברית ולאנגלית, ההבדלים ביניהן אמורים פחות להפריע לי. אני כבר לא מצפה לשים לב לדברים שיצרמו לי באופן בלתי מוכר.

ועם זאת, בשנתי הרביעית בפרקי הנוכחי בניכר, אני שמח להכריז על צרימה ממבע באנגלית (אמריקאית, לפחות דרומית אבל נדמה לי שלא רק) שתפסה אותי יחסית בהפתעה. את הביטוי "have a nice day" לבטח לא צריך להסביר לקהל הקוראים, יש לו אפילו מקבילה עברית צולעת "שיהיה לך יום נעים". ההפתעה מגיעה כשאדם מאחל כך לזולתו ומקבל בתגובה

Thanks, you do the same.

גם אתם מופתעים לשניה? בפעם-פעמיים הראשונות חשבתי שאולי העונה לא ממש מרוכז, או לא דובר ילידי של אנגלית, אבל וואלה כבר שמעתי את זה עשרות פעמים.

מקור ההפתעה במעין דיסוננס שנובע מההבדל התחבירי בין הפעל "להיות" במובנו השייכותי בעברית אל מול have. אין פה תופעה בלתי-מוכרת בעברית, הרי כבר דנו בצורה הלא-תקנית-בעברית-תנ"כית "יש לי את הספר", בה מבחינה רשמית את קודם לנושא ולא למושא, והמסקנה המקובלת היא שעברית מושפעת משפות אירופאיות בהן התרגום למשפט הוא משהו מהמבנה I have the book, שם אין ספק שהקניין מופיע כמושא.

אז השפעה-השפעה, ובכל זאת you do the same צורם לי. איך היינו עונים באותה רוח לאיחול העברי? משהו כמו "שיהיה גם לך" (בלי "תודה", כמובן). משהו בתגובה הזאת מרגיש… פסיבי. האדם שיש לו יום נעים סוג-של "מחזיק" בו, היום הוטל עליו, שפר עליו גורלו. בגרסה האנגלית, לעומת זאת, מרגישים (אני לפחות) שצריך לעשות משהו כדי לשריין את אותו היום הנעים, הרי ממש אומרים שם do. כדובר עברית, זה לא נשמע לי כמו משהו שאפשר לעשות.

האם אני רומז כאן לפער תרבותי בו הלבנטין מצפה שהעולם יטיל עליו יום נעים ואילו האירופאי החרוץ עמל להשגת טובו של היום? אני חושב שההבדל נעוץ יותר קרוב לשפה. אנחנו אולי נתרגם את do ברוב המקרים ל-"לעשות", אבל זה פעל שמתפקד גם כפעל-עזר עבור דברים הרבה פחות מוחשיים. ספציפית do the same פשוט מחליף כל צירוף פעלי בשפה באותה מידה שכינויי-גוף כמו he, she, it מחליפים צירופים שמניים שידועים בהקשר. והמהדרין גם מוסיפים דוגמאות ללא כל מקבילה עברית כמו how do you do?. אז נדמה לי שמקור ההפתעה שלי הוא אותו זכר ישן לתצורת "יש" כפעל שמצפה דווקא לנושא בתור הדבר שישנו, ולכן לא מתאים להחליפו בביטוי שמחליף צירוף פעל המורכב מפעל והמושאים שלו.

שיהיה לכם יום נעים!

Read Full Post »

[פוסט זה הוא פוסט חצי-אורח בשיתוף עם לימור נעמן]

חזרתיות בשפה היא תופעה מעניינת. דוברים יכולים לחזור על משפט שלם, אולי באינטונציה שונה, כדי להבהיר שהם עומדים לחלוטין מאחורי הרעיון שהם מבטאים (היא היתה שלך עוד בשלום, ג'רי. היא היתה שלך עוד בשלום). אם נרד לקומת המרתף, יש מילים שמכילות רצפי צלילים חוזרים, נניח כלבלב או צהבהב בעברית, באופן שיש לו משמעות מסודרת (כאן – הקטנה או החלשה). בעברית אולי זה לא ממש פרודוקטיבי (כלומר, מבנה שגם מילים חדשות לחלוטין ישתלבו בו בהקשרים חדשים לחלוטין, והמשמעות תהיה צפויה), לפחות לא על כל מילה (מחשבשב כספסף? כאילו, איחס?), אבל יש שפות כמו אינדונזית בהן זה ממש חלק מהדקדוק, במקרה שלה – ריבוי (kura – צב. kurakura – צבים). כשזה ברמת הבפנוכו של המילה כמו כאן, בלשנים קוראים לזה רדופליקציה (reduplication), ואנחנו משוכנעים שיש שם בדיחה מודעת לעצמה על התי"מ שהביטוי יוצר [למיטיבי לכת, יש את המאמר שלוקח את המשחק הזה עד 11 – רה-רדופליקעיישן לאלעק מאראנץ].

בין שני אלה, יש גם תופעה בשם ראיטרציה תחבירית (syntactic reiteration), שבה חוזרים על מילה בודדת באופן שמייצג סמנטיקה מסובכת יותר, סמנטיקה ששפות אחרות כנראה יבטאו באמצעות הרכב תחבירי סטנדרטי. באנגלית, למשל, ניתן לחזור על מילה כדי לנתק ממנה משמעות מטאפורית או כדי להעצים משמעות בסיסית שלה. תחשבו על הציטוט הנפוץ בסדרות נעורים אמריקאיות – Do you like him, or do you like-like him? האם את משתמשת במובן הלא-מחייב של "בסדר לי להיות בסביבתו", או שמא החיבוב שלך נושק לתחום הרומנטי? וגם – What kind of sandwich do you want – like a hamburger, or a sandwich-sandwich? האם האידיולקט (ניב אישי) שלך הוא מאלה שכוללים את ההמבורגר בקטגוריית הכריכים, או שהתכוונת שאזמין לך סנדוויץ' פרוטוטיפי שמורכב מממרח ודברים-חתוכים-דק בין פיסות לחם בלבד?

sand

מה הוא רוצה מאיתנו זה עם הסנדוויצ'ים שלו. מקור: טוויטר

בעברית יש (גם) את העניין הזה של ההעצמה – הלילה הוא לפעמים שחור ולפעמים שחור-שחור, תבשילים מקראיים הם לפעמים האדום האדום הזה, הגבר הסטריאוטיפי הוא לעתים גבר-גבר. אתה אוהב אותה או אוהב-אוהב אותה? אבל בעברית עוד נעסוק.

יש שפות שבהן לטקטיקה הזאת יש משמעויות יותר מרוחקות, כאלה שיוצאות מתחום המילה עצמה. למשל, באיטלקית סיציליאנית ראיטרציה יכולה לסמל העצמת פעולה:

האיש מדבר-מדבר

במקרה הזה הכוונה היא שנושא המשפט מדבר יותר מדי, או שהוא מזיין את השכל בכישרון רב. עוד שימוש למבנה הזה הוא במיקום אירוע או מאפיין כלשהם על שטח נרחב:

חיפשתי אותך שוק-שוק

משמעו חיפשתי אותך בשוק, אבל גם חיפשתי אותך בכל השוק. עוד דוגמה היא "יש לו פרצוף פצעים-פצעים" – כל הפרצוף שלו מלא פצעים (אפשר לראות את זה גם בעברית תלמודית: "בשרו נעשה חידודים חידודים").

אבל אנחנו בתוך עמנו חיים (לפחות כשאנחנו לא בלימודים), ועברית מודרנית כפּרה עליה יצקה סמנטיקה מעניינת אף היא אל תוככי הראיטרציה התחבירית (בנוסף על אופציית ההעצמה שהזכרנו קודם, שדי תחומה לתבנית אינטונציה מאוד מסוימת, בה מדגישים את המילה שאינה הראש התחבירי של הצירוף; ובנוסף על הביטוי הקפוא אחד-אחד בהוראתו הלא-נפוצה מדי של "לקחת פרטים משתי רשימות לסירוגין").

המשמעות המוכרת, והפרודוקטיבית, והמגניבה, היא של "אחד-אחד", מה קוראים ביידיש וואן ת'ינג אט א טיים [1]. כך, אם נאמר "עברתי על טיים-הליין של חידושי הניו יורק טיימס ציוץ-ציוץ", תהיה ברורה הכוונה "עברתי על כל ציוץ שם באופן פרטני, אחד אחרי השני". אם נאמר "אכלתי את האורז גרגיר-גרגיר", מתקבלת התמונה של אכילה מאוד איטית, כל פעם יש לי רק גרגיר אחד בהפה.

cows

פרה פרה (מקור: פליקר)

שימו לב שהיו כאן שני מרכיבים למשמעות. האחד, הכל דבר בתורו, "פרה פרה" אם תרצו, הוא בלתי נמנע. זו מטרת התופעה. כפועל יוצא, שם העצם החוזר חייב להיות ספיר, בן מניה, אחרת לא יהיה איך לעבור עליו ("שחיתי לאורך הבריכה מים-מים"???). השני הוא השלמות, או אולי יסודיות, של הפעולה המתבצעת, ככל שהיא נתונה בזמן עבר. יכול להיות שלא הספקתי הכל, אבל אז חובה עליי לציין זאת, ואפילו זה לא תמיד יספיק. "(אני עובר / ?עברתי) על טיים-הליין של שמעון ריקלין ציוץ ציוץ, בינתיים הגעתי רק עד מאי 2018". "?הילדה אכלה את האורז גרגיר-גרגיר עד שנמאס לה".

הטריגר לזה הפוסט הוא שזיהינו משמעות קשורה לזו של אחד-אחד, אבל איכשהו קצת שונה: כשהאלמנט החוזר הוא יחידת זמן, יש פתח לסמנטיקה אחרת. כשאני אומר "יום יום אני צריך להתמודד עם מה שעשיתי", אין פה באמת משמעות בדידה של אקט יומי, ומצד שני לא באמת משתמע שבכל יום ספציפי יש רגע ניתן לזיהוי שבו אני מתמודד עם אותו מעשה. הכוונה היא שבאופן כללי, מצב הנפש שלי הוא כזה שמכיל התמודדות, ואין חופשה מהנושא. אם משהו יזכיר לי את העניין, אאלץ להתמודד איתו. אם פספסתי ציוץ באותו טיים הליין, יצאתי טועה. אם פספסתי יום בתהליך ההתמודדות, לא ממש. באותה מידה, יכול להיות שבכל יום בדיד אני מתמודד עם העניין פעמים רבות. [במאמר מוסגר, לפעמים יום הוא רק יום: זוהר ארגוב תולש מהלוח דף יום-יום. בבירור, זהו אקט שקורה פעם אחת ביום, לא פחות ולא יותר.]

לימור מציעה פתרון לפלונטר: אם אפשר לתאר את טיים-הליין כמורכב ממקטעים של 280 תווים (גג!), כך אפשר לומר גם שהשעות ב"אני חושב עלייך שעה שעה" מורכבות כל אחת ממקטעים של שישים דקות – בפועל גם כל ציוץ נקרא על ידי יובל מילה מילה. במובן הזה, גם פיד הטוויטר וגם הזמן עצמו הם רצף: אחרי כל דקה באה עוד דקה, ואחרי כל ציוץ בא עוד ציוץ שממשיך אותו. מכאן שאירוע קריאת הציוצים הוא גם חלקיק וגם גל, ואפשר להתמקד בכל אחד מהאלמנטים – הרצף והמקטעים שמרכיבים אותו – לפי מה שמתאים לסיטואציה. התרגיל הסמנטי הזה נקרא refocusing, ואפשר לראות אותו גם באירועים שבהם נוסף פתאום עוד משתתף, כמו במשפט "רגע אחד לא השגחתי עליו והוא רץ לי לכביש". המשתתף הראשי באירוע הוא הזאטוט הנמרץ, אבל המילה לי מאירה בזרקור על הקורבן האמיתי בסיפור הזה: האמא המסכנה שלא מבינה במה חטאה שיש לה ילד כזה.

אז אם נקבל את העובדה שזמן הוא יצור מיוחד ומורכב בעולם המושגים שלנו, ושלא כל הדרכים הזמינות לנו לחלק אותו (לימים, לשעות, לדקות) הן שימושיות בהקשרים כמו "לחשוב על מישהי" או "להתמודד עם משהו", נוכל להבין את הצורך הזה בהגמשת תופעת החזרה, במקום להידרש למשמעות נוספת שלה.

המשך…

Read Full Post »

John Oliver Misses a Zeugma

Zeugmata Zeugmas are fun. We love them here on Dagesh Kal. Our inspiration at Language Log love them too (there's a list of posts here).

And yet, they might not be for everyone. Watch this snippet from John Oliver's August 5 show (17:17-17:34, or follow this link, or tell me how to embed non-YouTube videos on WordPress's new look).

I'm pretty sure the ad slogan mocked here is a moderately-clever zeugma on the verb try.

You see, to try (as in put to trial) a lot more often is a reasonable DA campaign promise (for those who are into that kind of thing). To try (as in, make an effort) harder fits just about any campaign.

Perhaps due to Oliver's (and his show's staff) low esteem of political ads, or the large variance between the frequency of the two meanings of try, or something I'm missing, he jabs at it as though both harder and a lot more often refer to effort.

 

Read Full Post »

שנת 2017 נחתמה והאגודה האמריקנית לבלשנות (ה-LSA) בחרה כמו בכל שנה את המאמר הטוב ביותר שהתפרסם בכתב העת שלה, Language. זו הזדמנות להיזכר בכך שבשנה שעברה הבחירה היתה קלה במיוחד: מאמרם של ג'ון ריקפורד ושריז קינג על דעה קדומה וגזענות ביחס התקשורתי והמשפטי לרייצ'ל ז'נטל, העדה המרכזית במה שמכונה משפט טרייבון מרטין (אבל למעשה היה מדינת פלורידה נגד ג'ורג' צימרמן). המשפט עצמו, אם יש צורך להזכיר, נגע לאירוע ב-2012 שבו ג'ורג' צימרמן (לבן-היספני) ירה בצעיר שחור לא-חמוש, טרייבון מרטין, באחד האירועים הזכורים יותר מקרב אירועי הירי של השנים האחרונות נגד שחורים בארה"ב.

המאמר עצמו הוא מופת של עבודה סוציובלשנית: הוא משלב תיאור מדעי מדויק עם היבטים חברתיים ומשפטיים, מנסה לא לשפוט את מי שלא זכה לחינוך בלשני מעמיק אבל שופך קיתונות של ביקורת כשמגיע. והמאמר חשוב. אני מביא כאן את עיקרי המאמר שמבוסס על נאומו של ריקפורד בכינוס השנתי של האגודה האמריקנית לבלשנות לפני שנתיים. את הנאום עצמו אפשר לראות (באיכות בינונית) כאן ואפשר גם לקרוא רשומה באנגלית שמביאה את קיצור העניינים כאן. בסוף אני חוזר בקצרה להעלות כמה שאלות לגבי תרחישים דומים בארץ, ואשמח לתגובות בעניין.

להגים בבית המשפט

הרעיון המרכזי שחוזר במאמר הוא שאף אחד לא התייחס לז'נטל ברצינות (במיוחד לא חבר המושבעים) בגלל שהם סלדו מהצורה שהיא מדברת: היא דוברת את הלהג העיקרי בו מדברת הקהילה השחורה בארה"ב, African American Vernacular English, דהיינו הניב האנגלי של אפריקנים אמריקנים או בקיצור AAVE. אבל את המאמר ריקפורד וקינג פותחים דווקא עם כמה דוגמאות מהיחס למיעוטים דוברי אנגלית בתיקים שהתנהלו במדינות אחרות, כולל עדים אבוריג'ינים באוסטרליה ועדים מרקע ג'מייקני בבריטניה. למשל, במקרה אחד הצורה שבה עד אמר את המילה ground 'קרקע' נשמעה לקלדן בתור gun 'רובה'. חשוב להזכיר כאן שאמנם מערכת המשפט בארה"ב מכבדת שפות שונות ומתעלמת מ"להגים" כמו AAVE, אבל אנחנו יודעים שההבדל בין שפה ודיאלקט הוא מלאכותי-פוליטי: שפה היא פשוט דיאלקט עם מספיק כוח כדי להיחשב לדרך "הנכונה" שבה מדברים.

האנקדוטות מעניינות ומבהירות את הנקודה אבל חשוב לציין אלה רק המקרים שהתגלגלו לספרות המקצועית. קל לנחש שמקרים רבים נוספים לעולם לא זכו לחשיפה הראויה להם. עוד נקודה מעניינת שמגיעה בסוף סעיף 2 של המאמר היא שהממשל האמריקני גייס מתורגמני AAVE במסגרת מבצע אכיפת סמים בדרום-מזרח ארה"ב ב-2010, אבל לא ממהר לגייס מתורגמנים עבור נאשמים בבית המשפט. בהקשר הזה המאמר מצטט את הסוציובלשן וולט וולפרם, שמזכיר כי האחריות לתקשורת ברורה נופלת איכשהו תמיד על המיעוט הלשוני/חברתי/פוליטי.

עדותה של ז'נטל

נחזור למשפט עצמו. תוכן העדות של ז'נטל מוכר לנו בינתיים ועיקרי הדברים מצביעים על אשמתו של צימרמן (לכאורה, בטח לכאורה): מרטין רץ הרחק מצימרמן ולא לכיוונו; הוא לא היה חמוש; הוא פחד ולא ידע למה עוקבים אחריו. מה שעוד מוכר, למרבה הצער, הוא התגובה הציבורית הארסית לעדות שלה. לא לתוכן, כמובן, אלא לצורה שבה היא דיברה. מבין כל העלבונות שהוטחו בז'נטל, הבולטים ביותר בהקשר הנוכחי הם אלה שקראו לה אידיוטית אשפתות גמגמנית. מה שעולה מהתגובות האלה, ונמצא באופן מפורש בכמה מהן, הוא שז'נטל כביכול מדברת אנגלית "שבורה": היא עושה "טעויות", היא "שוגה" שוב ושוב. הטיפול של ריקפורד וקינג בעניין הזה הוא טיפוסי עד כדי שיעמום עבור כל מי שלמד קורס בבלשנות: הם יושבים ומנתחים את הפונולוגיה, המורפולוגיה, התחביר והלקסיקון של ז'נטל במהלך העדות שלה (סעיף 3 במאמר). הם מסתמכים על ספרות מקצועית בת עשורים, מודדים תנועות והברות, מסרטטים גרפים ומנתחים את הפעלים והלוואים, בדיוק כמו שבלשנים עושים עם כל שפה אחרת. הדוגמאות רבות ולא אחזור עליהן כאן. התוצאה היא מערכת חוקים מורכבת למדי אבל עקבית להפליא, בדיוק כמו שמערכת השורשים והבניינים בעברית או מערכת פעלי העזר והזמנים באנגלית עקביות עד כדי שעמום. כמו שהמחברים מציינים לאורך המאמר, זו מסקנה מובנת מאליה עבור בלשנים אבל לא בהכרח עבור הציבור הרחב.

הקטע בעדות שבאמת העביר את חבר המושבעים על דעתו הוא כשז'נטל ציטטה את מרטין, שבתורו התייחס לצימרמן בתור nigga ו-creepy-ass cracka. אל מול הזעזוע הקדוש של חבר המושבעים הלבן, המחברים מסבירים בנינוחות שהמילה הראשונה כבר מזמן תועדה ככינוי לכל גבר שהוא, בלי קשר לגזע או צבע עור, ושז'נטל עצמה הסבירה את השימוש הזה באופן מפורש. הצירוף השני גם לא הרעיד את אמות הסיפים הבלשניות: creepy, משום שמרטין פחד. הסיומת ass משמשת להדגשה, ורבות נכתב בשנים האחרונות על התחביר שלה. ולבסוף cracka, אכן בתור מילת גנאי ללבנים. השילוב ביניהן גרם למצב פרדוקסלי שבו גזענות יוחסה למרטין, ולא למי שרדף אחריו וירה בו.

בסעיף 4 של המאמר מתועדות שלל דרכים שבהן חבר המושבעים התעלם מעדותה של ז'נטל או התייאש מלנסות ולהבין אותה. ההקשר המדעי המובא כאן הוא מחקרים על אי-יכולתם של אמריקנים לבנים להבין AAVE, נושא שתועד וכומת ממספר היבטים. כדי לחתום את החלק הזה, המאמר מזכיר את הספרות המקצועית שמדברת על דעות קדומות אותן אנחנו מבססים כלפי מיעוטים על סמך המבטא או הלהג שלהם, כש'אנחנו' כאן מתייחס הן למורים לבנים בבתי ספר בארה"ב והן לאנשי הנמבה והקלבארי בניז'ר.

סיכום

בשלב זה של הדיון ברור למדי שעדותה של ז'נטל לא נלקחה ברצינות. אם הייתה נלקחת ברצינות, אולי גזר הדין היה שונה בתכלית (צימרמן זוכה). בעמודים האחרונים של המאמר מנסים ריקפורד וקינג לבודד מספר המלצות להמשך. בין היתר הם חוזרים לטענה הפסולה לפי ז'נטל היא אנאלפבתית ומציבים אותה בהקשר של מחקרים רבים על הדרך הטובה ביותר ללמד מיעוטים ואכלוסיות נחלשות (גירסת בזק: אין שום מניעה ללמד מיעוטים בשפה שלהם או בלהג שלהם, ודווקא יש בזה מספר יתרונות). כמו כן, הם מעודדים את הקהילה הבלשנית עצמה לגלות יותר אחריות כלפי שפות מיעוטים וכיצד הן נתפסות (או במילים אחרות, stay woke).

שאלה אחת שעלתה אצלי לקראת סיום נוגעת לגבי המצב בארץ, וכאן אני מודה שאני לא מכיר את הספרות בנושא. אם נאשמת או עדה בבית המשפט אומרת "שני שקל" או "לשים סוודר", האם סביר יותר שנתייחס אליה בזלזול? או לגבי מבטא: אני יכול לשער שהגייה מזרחית עשוייה להיתפס כיוקרתית פחות מהגייה אשכנזית, אבל מצד שני אנחנו גם יודעים שהגייה מזרחית נתפסת פעמים רבות כאותנטית יותר. ומה לגבי נאשמים ערבים ורוסים שהעברית שלהם אמנם ילידית אבל עם מבטא? וכמובן, המצב ודאי גרוע יותר בקרב נאשמים שעברית אינה שפת האם שלהם ועושים טעויות של ממש, כאלה שנובעות מאי-שליטה בשפה. אנחנו הרי יודעים שאפילו שפות שחיו בקרבנו במשך מאות שנית, כמו ערבית, נתפשות היום כשיקוץ. אתפלא אם המרכיבים האלה לא גורמים לעיוות הדין.

John R. Rickford and Sharese King (2016). Language and Linguistics on Trial: Hearing Rachel Jeantel (and Other Vernacular Speakers) in the Courtroom and Beyond. Language 92(4):948-988.

Read Full Post »

צחוקו האפל של הגורל שהגה את מקור ייסורי המצפון המכבידים ביותר על הבלשן ההורה: מצד אחד, אם הורים לא כל כך בולגים כי למי יש זמן לזה. מצד שני, כשהורים, נחשפים לפלאי השפה המהודרים ביותר המגולמים בתהליך הזה שנקרא רכישת שפה. כשהורים שעוברים מדינה עם בת 3 שעכשיו כבר בת 4 וחצי, ושומעים את מה ששמעתי היום, זה כבר פשע בל יתואר לא לפתוח את ממשק הוורדפרס המזעזע ולתקתק במחשכים.

שום דבר לא הכין אותי לזה. הסעתי את הבנות מהגן הביתה, וברמזור מוציאה ענבל (4 וחצי כאמור) את רצף ההגאים הבא,  בדברה על אחותה קרן (תיכף 2. מטריה אצלה זה /bla/):

/aba, keren lakxa et ha-šu of./

ובהילוך איטי:

אבא, קרן לקחה את ה-shoe off.

מזל שהיינו ברמזור למה אחרת הייתי עושה תאונה. סערה מושלמת של תופעות קרוס-לשוניות, הלחמה של עברית ואנגלית בכל רמה שהיא, היבריש אמיתי.

נתחיל ברמה הלקסיקלית. ענבל לקחה את הפועל took ותרגמה אותו כפשוטו ללקחה, מה שלא עושה שכל בעברית שבה מורידים נעל, או בנודניקית שבה חולצים נעל.

הלאה לרמה הלקסיקלית-קומפוזיציונאלית. הרי גם באנגלית אנחנו לא take את הנעל. אנחנו take off את הנעל. ענבל שילבה את שני חלקי הפועל המורכב (phrasal verb) במשפט הסופי, אבל חלקו בתרגום מילוני לעברית וחלקו בשפת המקור.

ברמה המורפו-תחבירית, העניק לנו מנגנון השפה של הילדה את התיבה ha-shoe, שמורכב מקליטיק היידוע ה והמילה האנגלית shoe. מפלצת פרנקנשטיינית זוטא בינות לחלקי המפלצת הגדולה יותר של הפועל המורכב.

לסיכום, התחביר. הו, התחביר. שאלו מכובדיי, המשפט הזה הוא בסופו של דבר בעברית או באנגלית? אמר הלל הזקן – אנגלית כמובן! פועל מורכב שחלקו השני הוא מילת יחס זהו סממן מובהק של אנגלית ואם היתה אומרת לקחה את הנעל החוצה היית לבטח מאבחן כאן משפט אנגלי שעבר שמלול (רה-לקסיפיקציה; אין לי מושג אם באמת אומרים שמלול אבל אני על מסך מלא אז אין לי כוח לפתוח עוד לשונית לבדוק). בא שמאי הזקן לא פחות ודחפו באמת הבניין: עברית היא! מה למילת היחס את במשפט לועזי? "את השו", זהו צירוף עברי שעבר שמלול של המשלים השמני לאנגלית! לא זו אף זו, שבאנגלית לא מיידעים את הנעל הסתם כך, היא צריכה להיות her shoe! קם הלל וניער האבק מכתנתו ואמר וואלה יש לו פוינט לזה. ברמת המשפט הכללית הרי יש לנו מבנה שמתאים לשתי השפות (נושא לפני פועל לפני מושא). אם כן חברים וחברות, השתגית היבריש לתוך פרצוף שלכם.

לרגל המאורע, הנה ניתוח תחבירי לפי בית דקדוק התלויות סבא (dependencies). קשתות כחולות הן תחביר עברי, אדומות תחביר אנגלי, שחורות גם וגם.

keren-shoe-dep

Read Full Post »

היום, כפי שוודאי יודע כל מי מקוראינו שאינו גר תחת סלע, יוצאים תושבי הממלכה המאוחדת של בריטניה הגדולה וצפון אירלנד לקבוע את עתידה של ממלכתם המאוחדת של בריטניה הגדולה וצפון אירלנד בהאיחוד האירופי (באמת? זה כל השם הרשמי שלו? מאכזב). כיוון שבימינו אי-אפשר בלי איזה הלחם מעיק, וכיוון שיציאתה הספקולטיבית של יוון מאותו איחוד כונתה בכינוי הלא-רע-מדי Grexit (שמשחק על הקידומת Grec- ולכן זוכה לציון הלחם 2, תנועה ועיצור), בחרו הנודניקים הארורים מהתקשורת ועוזריה את הכינוי האנגלי Brexit, שמלבד היותו הלחם בעל ציון פונטי 0 (אין צליל משותף בין המילים המולחמות), הוא גם לא מאה אחוז נכון גיאוגרפית/פוליטית (כי, כאמור, גם צפון אירלנד ועוד כל מיני טריטוריות תלויות משתתפות במשאל וביציאה האמורה).

אבל זהו בלוג הבלשנות ״דגש קל״, לא בלוג הקנטרנות הגיאוגרפי ״מפת שולחן״. אך שלשום שם לב קברניט ספינת האם מארק ליברמן לכך שהמילה Brexit זוכה להגיה שונה מפיהם של אנשים שונים: חלק הוגים את האיקס כזוג עיצורים בלתי-קוליים, /ks/, וחלק כקוליים, /gz/. טובי הניואנסרים שביניכם אולי שמו לב שהקרי הראשון נפוץ יותר בממלכה המאוחדת שבהגוצ״א, והשני בארצות הברית של אמריקה. ליברמן תוהה כך על קולו הפנימי, שבגד באמריקאיותו והיה קורא באופן בלתי-קולי עד שהחל לשמוע שידורים אמריקאיים בנושא וחש את הדיסוננס. הוא מעלה את הסברה של זכרון ה-Grexit, שם העיצור /k/ דומיננטי בשל השורש התורם הראשון (ואכן, בלי ה-Grexit לא היינו ״זוכים״ למונח Brexit).

בתגובה לאותו פוסט כותב מגיב מסוקס במיוחד שגם אצלו היה המצב בלתי-קולי, אך שכאן סבל מהתעתיק העברי שמחייב את הכותב להחליט בין שני הקריאים ולהאכיל את הקורא באחד מהם. מכאן, כיוון שכותבים ברקסיט בעיתונות לשון עבר, שגם הייצוג הפונטי בראש יתיישר. אממא, ממשיך אותו פנומן, מילה אחרת שיובאה לעברית היא exit עצמה, במובן של מכירת חברה לתאגיד גדול ממנה תוך גזירת קופון נאה, וכאן דווקא בחרה העברית בתעתיק אקזיט, השד יודע למה. הצמדת עיצור קולי (/z/) לבלתי-קולי (/k/) באותו צרור היא קשה מאוד לדוברי כל שפה שהיא, ובואו נסו להגות כך את המילה. אני מחכה.

Screen Shot 2016-06-23 at 13.33.54

בינתיים, קחו ראייה בלתי תלויה לחלוטין.

באותה הזדמנות, נסו אגסיט. קצת יותר קל, אבל עדיין דורש מאמץ.

 

כך או כך, את אותו ״אקזיט״ נוהגים להגות בעברית עם /gz/. ובכן יונית, דיסוננס. למה אותה מילה אנגלית מקבלת טיפול שונה כשהיא בגפה וכשהיא בהלחם? אז יכול להיות שהמשמעויות מספיק שונות כדי שאף אחד לא ישים לב ולא יהיה אכפת. הרי לא מדובר פה באקזיט חגיגי של הממלכה המאוחדת שבהגוצ״א שבו מישהו קונה ממנה את פירות השהות באיחוד. אפילו מבחינת תומכי המהלך תהא זו מעין מנוסה מבוהלת מיבשת שוקעת. ואם המשמעות לא נגזרת ממילה שנהוגה בעברית, אזי אפשר פשוט לתעתק אותה (1) כפי שהיא נהגית, ואז באמת נשמע אותה יותר מבריטים מאשר מאמריקאים; או (2) ״כמו שהיא נכתבת״, ואז X בפני עצמה באמת נתפסת בעברית יותר כ-״קס״, כלומר כשהיא לא ״ח״. עיינו קסילופון, מקסימום, דיאודורנט אקס, אקס פקטור, אקסית מיתולוגית.

כעת תשאלו: ״שיואו, יובל, אחלה מקרה! יש לך עוד דוגמאות למילים שהגיעו פעמיים לעברית בתעתיקים שונים?״ ולאחר שאודה על המחמאה אשיב: ״אמ, צ׳מעו, אז מצאתי כמה, אבל יש להם דרך קצת עקלקלה. נניח פנצ׳ר וקונטרפונקט, שבאו משפות מקור שונות אבל מכילות את המרכיב הזהה /punct/, הולך?״ ואז די תתאכזבו ותשאלו אם אני יכול להציע לקוראים לתרום משלהם בתגובות. ואז תיזכרו לרגע בעת שתפנו ללכת ותגידו ״אבל בעצם ראינו כמה פעמים שכותבים ברקזיט. ואפילו קישרו את זה לאקזיט״.

אז זה כבר רציני. למרות שבהן צדקי אשבע שעד לגיגול שגיגלתי בזה הרגע לא נתקלתי ב״ברקזיט״, הוא קיים גם קיים. ואפילו מנצח במבחן הגוגל, ואפילו אינו מוגבל רק לאתרי הכלכלונים.

Screen Shot 2016-06-23 at 13.12.02

אגזיביט איי

Screen Shot 2016-06-23 at 13.12.14

אקסיביט בי

לפחות לשתי האפשרויות האחרות אין ראיה (אם כי, כאמור, ברגזיט היא הגייה הגיונית).

נתראה עוד חצי שנה!

Read Full Post »

סערה זוטא התחוללה לאחרונה בבית היהודי בשולי הנסיון לצרף את אלי אוחנה לרשימה. ח"כ זבולון כלפה, אחד מאנשי מפלגת תקומה שרצה במסגרת הבית היהודי, התפטר מהמפלגה על רקע שריונו של אוחנה. כלפה שלח מכתב התפטרות ליו"ר המפלגה, ח"כ אורי אריאל, והמכתב צוטט בצורה כזו או אחרת בכלי התקשורת.

למה אני אומר "כזו או אחרת"? כי נפלו כמה שגיאות מעניינות במכתב כפי שצוטט, ואי אפשר בדיוק לדעת אם השגיאות במקור אצל כלפה או אצל התשקורת. בין היתר מצוטט ח"כ כלפה בתור מי שאמר ש:

(1) אני חושב שמישהו איבד את המצפן
(2) טוב לעשות גירושים לפני שיש ילדים
(3) זה לא רק גשם שיורד אלינו, זו יריקה
(4) אי אפשר לומר שכלום קרה

בהארץ ובהבהחדרי חרדים אפשר למצוא את כל הארבעה, אבל חדרי חרדים תיקנו את "גירושים" ב-(2) ל-"גירושין". בכיפה ובכיכר השבת גם אפשר למצוא את כל הארבעה אבל בלי הפסיק ב-(3). בחרדים10, להבדיל, מצטטים מכתב שונה בגוף הכתבה אבל כן מצטטים את (3) בכותרת המשנה.

נניח שלפחות חלק מהשגיאות הופיעו במכתב המקורי, אבל יכול גם להיות שאתרי התקשורת לא הקפידו על ציטוט מדויק של המכתב. בואו נחזור לדוגמאות (1)-(4) ונראה מה קורה בהן.

(1) איבד את המצפן: כמעט עירוב ביטויים. הביטוי המקובל הוא איבד את הצפון, אבל מי שמנהיג אמור לנווט בעזרת מצפן. ישנו גם מצפן מוסרי, שאילה אפשרית מאנגלית.

(2) גירושים / גירושין: שתי הצורות תקינות. הוועדה למונחי דמוגרפיה של האקדמיה ללשון העדיפה את הסיומת העבריתים על פני הסיומת הארמית –ין, אך שתיהן תקפות (רק איך אומרים דמוגרפיה בעברית?).

(3) הגשם יורד עלינו ממעל, לא אלינו. אין לי הסבר לבחירה ב-(3). זו יכולה להיות שגיאת כתיב (עם אל"ף במקום עי"ן) וזו יכולה להיות בחירה במילת יחס לא נכונה.

(4) גם כלום קרה זה מוזר. הרי בעברית יש שלילה כפולה וצריך לומר "כלום לא קרה". אולי אפשר להבין את (4) יותר בקלות אם מדגישים את "כלום": אי אפשר לומר שכלום קרה, הרי משהו קרה.

שיהיה ברור, כבלשן אני לא מחפש ללעוג לשגיאות של ח"כ כלפה. אני יותר סקרן לדעת מה הגורם לשגיאה, כי השגיאות של היום הם הדקדוק של מחר. באותה מידה מסקרן גם לדעת האם השגיאות הן באמת שלו או של אמצעי התקשורת השונים: למה להוסיף או להוריד פסיק? למה לשנות את "גירושים" ל-"גירושין"? ובאיזה מקרים מותר להחריג את הציטוט מהמבע המקורי?

[ת' לאורה]

Read Full Post »

(First posted on Language Log as a guest post)

Reading Mark Liberman's analysis of Obama's SOTU addresses versus other presidents', my thirst remained unquenched. Word-counts are fun, sure, but the real fun comes in when looking at longer phrases – two (bigrams) or three (trigrams) words long.

After waiting for it to be breakfast time in Philadelphia, I engaged in an experiment (Legal has advised me against explicit use of MYL's trademark phrase) to analyze the 228 addresses (found here) and see what Obama's favorite (and least-favorite) phrases are.

Since I worked with raw data, I handled it a bit differently than previous analyses just for the sake of getting results fast. To begin with, I did not weed out the non-orally-delivered addresses or any other "special" cases. Next, I used an unsophisticated tokenization algorithm where all apostrophes break words into tokens (so "Congress's" is split in two, as in Liberman's analysis, but same goes for "i'm" and "he's"). Lastly, I used a comparison algorithm which only takes into account Obama's speeches and all addresses (1790-2014) as "background": the KL measure, which purports to tell us how "informative" the phrase is in the Obama corpus relative to the background corpus.

Let's get to it: here are Obama's most unexpectedly frequent bigrams:

bigram KL-measure X 1000
that 's 3.284
it 's 2.463
let 's 2.022
don 't 1.545
i 'm 1.540
we will 1.408
's why 1.375
we 're 1.278
we 've 1.253
can 't 1.147
right now 1.092
clean energy 0.960
i will 0.946
if you 0.931
need to 0.925
we 'll 0.907
we can 0.902
is why 0.883
jobs and 0.848
's what 0.844
health care 0.842
tonight i 0.825
our economy 0.813
's not 0.736
middle class 0.696

We see many stylistic markers here, such as the contracted forms "'s", "'re" and "'ll", which will probably re-appear in any modern president's lingo (with not much to support either the egocentric-Obama or collective-Obama hypotheses), but these expected bigrams greatly emphasize the magnitude of the more content-swayed ones: "our economy", "middle class", "health care" and the number one issue on Obama's plate (at least according to Kullback and Leibler): "clean energy".

Obama's most unexpectedly infrequent bigrams: (for these, I still only took phrases which appeared somewhere in Obama's addresses)

bigram KL-measure X 1000
of the -2.388
to the -0.941
in the -0.896
for the -0.529
and the -0.494
by the -0.446
it is -0.397
PAR the -0.392
united states -0.389
the united -0.388

And the rest is just as boring. We've seen "the" is on the decline, and it drags down all its associated bigrams with it.

Moving on. Favorite trigrams: ("PAR" marks the beginning of a paragraph)

trigram KL-measure X 1000
that 's why 1.191
that 's what 0.750
that is why 0.640
democrats and republicans 0.549
we need to 0.526
it 's not 0.495
this congress to 0.432
PAR that 's 0.426
the american people 0.413
i will not 0.406
so let 's 0.405
tonight i 'm 0.399
we can 't 0.391
states of america 0.369
it 's time 0.353
across the country 0.336
's why i 0.325
's why we 0.324
over the last 0.319
over the next 0.313
we have to 0.312
i took office 0.312
i know that 0.310
's time to 0.304
PAR of course 0.304

So the top three are explanation starters, but check out "democrats and republicans" creeping in to a bipartisan content-lead. And you may take what you will from number 25, beginning paragraphs with "of course".

Least favorite trigrams:

trigram KL-measure X 1000
the united states -0.375
of the united -0.134
of the country -0.054
part of the -0.048
as well as -0.046
the people of -0.044
of the people -0.044
PAR it is -0.043
united states and -0.040
of the government -0.032
the secretary of -0.030
it will be -0.029
the federal government -0.029
and it is -0.026
and in the -0.026
at the same -0.026
of our citizens -0.026
the number of -0.025
of the last -0.024
the fact that -0.023
of the union -0.023
in order to -0.022
it is not -0.022
and to the -0.022
it is a -0.022

A bit more interesting than the lost bigram table. "the american people" made it to the top, but "the people of" are on the bottom, suggesting nothing but a stylistic anomaly (or shift) in denoting what is probably the group which is most referred to in these addresses. How "the united states" and "states of america" got to opposite ends is beyond me, though. Much to look into, perhaps during some breakfast after next year's SOTU.

Read Full Post »

הפרסומת הבאה לקוקה קולה שודרה אתמול במהלך הסופר בול. השיר הפטריוטי America the Beautiful הוקלט במספר שפות ונשא איתו מסר מלבב של אחדות, חירות, צרכנות וכן הלאה:

ב-Language Log תיעדו את הסיקור התקשורתי ומנו את השפות המשתתפות בקליפ:

Coca-Cola ran a commercial with a multilingual rendition of "America the Beautiful," with languages including English, Spanish, Keres Pueblo, Tagalog, Hindi, Senegalese French, and Hebrew.

אני לא שמתי לב לעברית כשראיתי את הפרסומת, אבל השורה הלפני-אחרונה (החל משנייה 43) היא באמת בשפת הקודש: משהו כמו "ברוב טובך יכתיר אותך" (אני לא בטוח לגבי המילה הראשונה), תרגום של חלק מהשורה המקורית "And crown thy good with brotherhood".

למזלנו החברה סיפקה מבט אל מאחורי הקלעים ובו ניתן לשמוע חלקים נרחבים יותר מהשיר. הנה מעט יותר על הביצוע בעברית, של ילדה בשם נטלי:

למה קשה להבין את המילים בשמיעה ראשונה? יש כמה סיבות. ראשית, התרגום מילולי למדי. שנית, ההגייה של נטלי משקפת את העובדה שהיא (ככל הנראה) גדלה בארה"ב. לא נדיר להיתקל בילדים דוברי-עברית שגדלו בארה"ב וההגייה שלהם מושפעת מהפונולוגיה של אנגלית; רמת השליטה שלהם בעברית עשויה להיות טובה מאוד או גרועה למדי (מה שנקרא heritage speakers) אבל ההגייה מושפעת באופן בולט. נטלי אמנם הוגה את הרי"ש שלה בסדר, אבל הת"ו מחוככת למדי, הלמ"ד לועית מדי וכמה מהמילים זרות לה בבירור. כך למשל היא מבטאת את המילה "ענבר" עם בי"ת רפה ואת המילה "דגן" יותר כמו "צגן".

הנה המילים לשיר באנגלית, ואתם מוזמנים לנסות לפענח את התרגום בעצמכם (תיכף ניתן את הפתרון). בחיפושיי מצאתי גירסה יפה בעברית לבית הראשון, מאת אדם בשם יורם קולרשטיין (דרך הפוסט המושקע כאן):

יפֵהפִיָה ללא גבולות
וּזְהב דגן גלִי
הרים סגוּלים סְפוּגים בְּהוֹד
מישור עמוּס בִּפְרי
אמריקה אַת אֶרץ
שהאל בּרֵךְ בלי סוף
וּבְרית אחים נאמנה
תִשְׂרוֹר מחוף אל חוף.

אם כן, את הבית הראשון בן לי ואני ניסינו להבין בזריזות, אבל נתקענו קצת לקראת הסוף:

הו יפת שמים רחבים O beautiful for spacious skies,
וגלי ענבר דגן For amber waves of grain,
הדר הרים סגולים For purple mountain majesties
מעל שדה ??? Above the fruited plain!

גם הילדה ששרה במנדרינית, למשל, מבטאת לא נכון כמה עיצורים. הילדה ששרה בערבית מבטאת את המילים בסדר, אבל לרוע המזל המשקל של השיר מתנגש חזיתית עם התרגום מרובה-ההברות לערבית. כור היתוך.

Read Full Post »

לא מזמן נתקלתי בשלט הבא בכניסה לבנק ותהיתי, למה הכוונה ב-"חל איסור כניסה לסניף לחובשי קסדה"?

helmet0513

למה אני מתכוון, בלשן טרחן שכמותי? ובכן, זה לא יכול להיות שכל חובשי הקסדות מנועים להיכנס. אני מגיע לעבודה באופניים ואני מקפיד לחבוש קסדה כשאני רוכב – מכאן, שאני חובש קסדה. אבל לא מזה הוטרדה הנהלת הבנק, כמובן: הם מודאגים מאנשים שחובשים קסדה כשהם בתוך הסניף.

הבעיה היא שהביטוי חובש קסדה הוא דו-משמעי. בלשנים מדברים על stage-level predicates, כלומר פרדיקטים שנכונים ברגע מסוים, מול individual-level predicates, כלומר פרדיקטים שנכונים עבור פרט מסוים כל הזמן. יש אנשים שחובשים קסדה כשהם בתוך הבנק ועומדים לשדוד אותו. ויש אנשים שחובשים קסדה דרך קבע; הם רק רוצים נסיעה בטוחה.

הדוגמה הקלאסית בספרות המקצועית דנה בשני הפרידקטים נבון וזמין:

(1) יש שוטרים זמינים (policemen are available)

(2) יש שוטרים נבונים (policemen are intelligent)

בדוגמה (1), מדובר על כמה שוטרים שזמינים כרגע. זה פרדיקט שנכון לרגע בזמן, ל-stage. בדוגמה (2) מדובר על שוטרים שהם פשוט נבונים – זה נכון ברמת הפרט, ה-individual.

הספרות המקצועית בנושא ענפה ולא אכביר מילים עליה, בין היתר כי בין קוראינו הקבועים יש אנשים שהם ממש מומחים לנושא. רק אציין שבעברית אפשר להבדיל יפה בין שתי המשמעויות באמצעות שימוש באוגד. הדוגמאות (5)-(3) הן חד משמעיות.

(3) דני הוא חובש קסדה.

(4) דינה שמחה (היום).

(5) דינה היא (ילדה) שמחה.

במשפט (3), הקרי היחיד הוא זה בו דני מרכיב קסדה דרך קבע. משפט (4) משמעו שדינה שמחה כרגע, ואילו משפט (5) מציין עובדה כללית לגבי דינה. אבל לא הייתי מצפה מהנהלת הבנק לכתוב "חל איסור כניסה לסניף לחובשי קסדה שאינם אנשים שהם חובשי קסדה".

Read Full Post »

שכה יהיה לי טוב, ככה בדיוק כתוב בטיפ זיכרון של ערן כץ בטמקא (כשרוצים לשכוח: 5 דרכים למחוק זכרונות לא רצויים, 4.5.2013):

לסלוח – להקהות את הרגש

אין זה מקרי שהמילים Forget (לשכוח) ו Forgive (לסלוח) נגזרות מאותו השורש. מתן סליחה למי שחולל את הזיכרון הרע מקהה את הרגש החזק המלווה את הזיכרון, שלב ראשון והכרחי במחיקת הזיכרון.

לעתים אין באפשרותנו לשנות מצב קיים אבל יש באפשרותנו לשנות את גישתנו למצב מסוים. "לטעות זה אנושי. לסלוח – אלוהי" אמר המשורר אלכסנדר פופ. הסליחה, דרך אגב, מיועדת הן לאחרים והן לעצמנו.

הבנתם? המילים forget ו-forgive נגזרות מאותו השורש. איזה שורש? מה זה חשוב, אותו השורש. לא באמת צריך להסביר טענות מופרכות כשכותבים על שפה.

אבל הן לא. נכון, שתיהן מעוטרות בתחילית for, אבל זו לא יכולה להיות הכוונה משום שגם המילה forlorn משתמשת בתחילית הזו שמשמעותה הישנה היא 'לגמרי' (דוברי הגרמנית בקהל יכולים להשוות ל-ver).

אולי כץ חושב ש-forg הוא שורש, ובמקרה כזה אנחנו אמורים להסיק שישנן שתי סיומות אפשריות, ive ו-et. אחסוך לכם את החיפוש: אלה אינן סיומות לפעלים באנגלית. חבל, כי את האטימולוגיה הנכונה אפשר למצוא בקלות: הנה forgive והנה forget.

מצד שני, כץ מכפר על הטעות הזו. חברת שירותי הזיכרון שלו, Smart Memory, מפרסמת את עצמה כך באתר הבית שלה:

ערן כץ, אמן תרגילי הזיכרון, מחבר רבי המכר ומרצה בינלאומי לזיכרון והאינטליגנציה
עזר ללמעלה ממיליון איש בעשרים מדינות לפתח מיומנויות זיכרון יוצאות דופן

מרצה בינלאומי לזיכרון והאינטיליגנציה! מי שמשתמש כך ביידוע מיותר מתחבב עלי אוטומטית, ואני מוכן לשכוח ולסלוח לו.

[תודה לתע"ג]

Read Full Post »

[בלה פוסט אורחת בלה גבי סטנובסקי בלה סטודנט לבלשנות בלה באוניברסיטת בת בלה]

לאחרונה נתקלתי ברשת במספר אלגוריתמים לשוניים מעניינים ומוזרים שהוצעו בשפה האנגלית. עניין אותי לנסות ולשחזר אותם עבור השפה העברית. רשומה זו סוקרת את האלגוריתמים, את הכלים החישוביים אשר נעשה בהם שימוש, ומספקת מקבילה עברית שלהם.

NURBLE

במקור

מן הקומיקס המעולה SMBC של הכותב והמאייר זק ווינר (Zach Weiner). בקומיקס מועלים לא פעם רעיונות מתחומים רבים, חלקם דמיוניים לחלוטין, וחלקם מתבררים כפרקטיים למדי.

באחד הקומיקסים הכותב העלה את הסברה כי ניתן לשפר טקסטים פוליטיים ע"י שינוי כל מילה שאינה שם עצם ל-NURBLE. עוקב טוויטר חרוץ לא איחר להגיב עם תוכנה קטנה שעושה בדיוק את זה – מקבלת טקסט, ומחזירה אותו "מנורבל".

הרעיון לא חמק מעינם של הכותבים של לאנגואג' לוג, אלו התייחסו בפוסט שבו הוצעו מספר "מנרבלים" נוספים.

איך זה נעשה

התוכנה הקטנה ששלח העוקב (שנכתבה בשפת PHP) עושה שימוש במשאב חיצוני – קובץ המכיל מאגר מילים וחלק הדיבר שלהם. התוכנה עוברת מילה-מילה על הטקסט אותו יש לנרבל, ובודקת לפי המאגר האם המילה היא שם עצם או לאו – בהתאם היא מחזירה Nurble, או את המילה עצמה.

התוצאה

מעניינת ומשעשעת למדי, ניתן להתרשם באותו הקומיקס מהרצה של האלגוריתם על נאום המצב לאומה של אובמה. באופן מפתיע ניתן להבין את רובו, גם כאשר הרוב המוחלט של המילים "מנורבל".

בעברית

כפי שראינו התוכנה המקורית עשתה שימוש במאגר מילים ממשאב חיצוני. למיטב ידיעתי משאב שכזה לא קיים בשפה העברית. בנוסף, כנראה שנטייתה של השפה העברית לעמימות תחבירית יקשה מאד על שימוש במשאב כזה, גם אם קיים. מסיבות אלו נעשה שימוש במתייג – פונקציה אשר בקבלת משפט מחזירה, בין השאר, את חלקי הדיבר של מילותיו (עוד על כך בהמשך) באחוזי ההצלחה מסוימים. בהינתן פונקציה כזו הפתרון למשימה נעשה טריוויאלי – נעבור על כל המשפטים בקלט, נזין אותם למתייג, ונברור את שמות העצם מתוכם.

התוצאה

התרשמו בעצמכם מ"נירבול" נאומו של יאיר לפיד במליאה:

מקור, ולאחר נירבול.

עינכם הרואות – ה"נארבל" עשה עלייה ל-"בלה", לדעתי גם במקרה הזה ניתן להבין את המסר בקווים כלליים.

נסו בעצמכם

אם אתם מעוניינים לבדוק בעצמכם את ההשפעה של הנירבול על טקסטים אחרים, העלתי מדגים של התוכנה (לאחר הכנסת הטקסט, סמנו את האופציה NURBLE).

אתנחתא – מתייגים, מפיגי עמימות ומודלים סטטיסטיים

בתחום הבלשנות החישובית קיימים מספר תחומים ובעיות אשר נחקרו רבות בשנים האחרונות – רובן בעיות בסיסיות אשר פתרון שלהן יהווה בסיס כמעט לכל מערכת אשר רוצה לעשות שימוש בשפה טבעית. בין אלו ניתן למצוא: תיוג חלקי דיבר (Part Of Speech Tagging), זיהוי ביטויים שמניים (NP Chuncking) וזיהוי ישויות (Named Entity Recognition). קל לראות כי אלו הן אבני הבסיס למשימות "מורכבות" יותר, דוגמת ניתוח תחבירי (Parsing), תרגום מכונה, סיכום אוטומטי, ועוד.

בניגוד למשימות ה"מורכבות", במשימות בסיס אלו קיימת לרוב הסכמה בין דוברי השפה לגבי הפלט הרצוי. כך, כל דובר שפה עברית יסכים כי חלק הדיבר של המילה "רץ" במשפט "גל רץ הביתה" הנו פועל (Verb), בעוד שספק אם קיימים שני אנשים שונים אשר יסכמו את הרשומה הזו לכדי אותו סיכום.

כמובן שבעיות אלו הנן תלויות שפה עד מאד, והאלגוריתמים אשר מנסים לפתור אותן חייבים להתייחס למאפייניה הייחודיים של השפה אליה הם מכוונים פתרונן. למשל אופייה הצירופי (word agglutination) של השפה העברית עלול להקשות רבות על כותבי אלגוריתמים כנ"ל לשפה העברית – אלגוריתמים אלו צריכים להפיג את העמימות באשר היא קיימת לגבי המילים במשפט. אם נסתכל שוב על המילה "רץ" הפעם במשפט "גל הזיז את הרץ למשבצת הסמוכה", ברור כי יש להתייחס למילה רץ בתור שם עצם, בניגוד לפועל שראינו במשפט לעיל – אלגוריתמים אלו יצטרכו לבחור את הפירוש הנכון למילה בהינתן ההקשר המתאים. [ראו גם כאן וכאן – א"ק]

המגמה הבולטת בשנים האחרונות לתקיפת בעיות אלו היא גישה הסתברותית (סטוכסטית). ניתן לייחס זאת להתחזקות כוח המחשוב, לקורפוסים העצומים והבלתי מעובדים (unstructured corpora) של שפה טבעית שמשתמשי האינטרנט מייצרים על בסיס יומיומי, ולאכזבה כללית ממודלים דטרמיניסטיים ו-"שלמים" יותר שהוצגו בעבר.

אלגוריתמים הנוקטים בגישה זו מניחים קיום של מודל כלשהו אשר ממנו מופקים משפטים תקינים בשפה או שבעזרתו ניתן לנתח משפטים בשפה טבעית. כך לדוגמא רשתות נוירונים מניחות קיומו של מודל המפשט את המוח האנושי לכדי נוירונים אשר מופעלים לפי פונקציות הפעלה מסוימות (activation function), ומודלי מרקוב חבויים (Hidden Markov Models) מניחים קיומו של מודל של מכונת מצבים, אשר המעבר בין המצבים תלוי במשפט הקלט ובהסתברות מסוימת.

מודלים אלו נמצאים בבסיס האלגוריתמים הסטוכסטיים. אופיינית, אלגוריתמים אלו יתחילו מתהליך של "אימון" על משפטי קלט משפה טבעית. תהליך זה מטרתו לכייל את הפרמטרים אשר מוטבעים במודל. כך ברשתות נוירונים יכוילו המשקלים אשר ניתנים לכל נוירון, ובמודלי מרקוב חבויים תכוילנה ההסתברויות למעבר בין המצבים.למעשה ניתן לומר כי תהליך האימון מתאים את המודל למשימה הספציפית מולה ניצבים.

לאחר שלב האימון, מפסיקים לכייל את הפרמטרים של המודל ומציגים בפניו משפטים שלא חזה בהם בשלב האימון. בתקווה, המודל אכן יודע להכליל איזושהי תחזית לגבי כלל המשפטים בשפה (או בחלק נרחב ממנה), ולכן יוכל לתת תשובות באמינות מסוימת גם עבור משפטים שלא ראה בעבר.

חלק מן החכמה בכתיבת מערכות שכאלו כוללת את בחירת המודל, אפיון הפרמטרים שלא ישתנו במהלך האימון (לדוגמא, טופולוגיית הרשת במקרה של רשתות נוירונים), ובחירת המאפיינים (features) שיהוו קלט למודל הנבחר.

עבור מימוש שני האלגוריתמים הפשוטים יחסית שמתוארים ברשומה זו, עשיתי שימוש במתייג ומפיג העמימות שנכתב על ידי מני אדלר מאוניברסיטת בן גוריון. משפטים שלמים מן הקלט מוזנים אליו, ובתמורה מקבלים עבור כל מילה בין השאר את חלק הדיבר שלה (בו כבר עשינו שימוש עבור אלגוריתם NURBLE) את הבניין, הזמן, המין, הגוף, ואת צורת הריבוי שלה – בכל אלו נעשה שימוש באלגוריתם הבא שיתואר.

Jailbreak the Patriarchy

במקור

במקרה הזה מדובר בתוסף לשוני מוזר לדפדפן chrome שמתיימר לשבור את הפטריארכיה השלטת ברשת.

התוסף מחליף בטקסט דפי האינטרנט שמות גוף זכריים לנקביים ולהיפך. בנוסף הוא מחפש ביטויים זכריים מסוימים ומחליף אותם במקבילה הנקבית שלהם, ולהיפך. כך לדוגמא "he loved his mother very much" יהפוך ל-"she loved her father very much" ו-"the patriarchy also hurts men" יומר ל- "the matriarchy also hurts women".

איך זה נעשה

לפי תיאור התוסף, נראה כי מדובר במשימת "חפש-החלף" פשוטה יחסית: התוסף עובר על הטקסט בדף, ומחפש ביטויים שנקבעו מראש. ברוב המשפטים אכן מושגת החלפת מין (gender swapping, לפי הכותב), זאת מכיוון שרוב חלקי הדיבר בשפה האנגלית הם ניטרליים מבחינת מין.

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

בעברית

בדומה לאלגוריתם הקודם, נראה כי הגישה שננקטה במקור לא תספק מענה הולם בעברית. נסתכל על הדוגמא שנתנה בחלק הקודם:

  • גל רץ הביתה.
  • גל הזיז את הרץ למשבצת הסמוכה.

נניח כי נבצע משימה של חיפוש והחלפה, ונרצה להחליף את "רץ" ב-"רצה", נקבל:

  • גל רצה הביתה
  • * גל הזיז את הרצה למשבצת הסמוכה

ברור כי זוהי אינה התנהגות רצויה, וכאמור, בשפה האנגלית לרוב לא נתקלים בקשיים שכאלו.

הדרך בה נקטתי לפתרון הבעיה הנה שימוש במתייג שהוזכר לעיל – ממנו דליתי עבור כל מילה בקלט את חלק הדיבר שלה, בהתאם הפעלתי עליה פונקציית החלפת מין. אתאר את הפונקציות עבור חלקי הדיבר שם-גוף ופעלים:

שמות גוף:
בהינתן הידע כי מילה מסוימת היא שם גוף, והעובדה כי שמות הגוף היא קבוצה סגורה וקטנה יחסית של מילים, ניתן להשתמש בטבלה פשוטה ולהמיר "הוא" <-> "היא", "הם" <->"הן" וכיו"ב.

פעלים:
בהינתן הפרמטרים הבאים עבור מילה: בניין, זמן, מין, גוף, ואת צורת הריבוי שלה. ניתן להשתמש בחוקי התחביר העברי, לגזור את השורש ולשתול אותו במקבילה הנקבית / זכרית.
בנוסף לאלו, הכנסתי גם רשימת ביטויים בעלי מין אותם האלגוריתם מחליף, בדומה לתוסף המקורי – "אמא" <->"אבא", "פטריארכיה" <-> "מטריארכיה" ועוד.

התוצאה

מעניינת, אך רחוקה מלהיות מושלמת. אם להמשיך באותו קו של דוגמאות, בחרתי את פוסט הפייסבוק שמשום מה התפרסם בזמן האחרון על ריקי כהן הדמיונית, וזוהי התוצאה: "אני רוצה שנדבר על מר כהן". ניתן לראות כי ביטויים רבים מבלבלים את התוכנה, אולם ברגעיה היפים יוצאים משפטים לתפארת מרב מיכאלי.

נסו בעצמכם

גם בתוכנה זו ניתן להתנסות בהמרת מינו של כל ביטוי העולה על רוחכם – כאן (לאחר הכנסת הטקסט, סמנו את האופציה Jailbreak).

[בלה בלה רשומת אורחת בלה גבי בלה בלה בלה פוסט אורחת בלה צרו בלה קשר בלה בלה דרך הטופס בעמוד בלה בלה]

Read Full Post »

אולי שמו לנו משהו במים אבל לאחרונה מתפרסמים כמה טורים טובים למדי על שפה. הזכרנו לא מזמן את השפעת השפה הרפואית על התודעה, ואך לפני כמה ימים הופיע טור של על הוראת הלשון בבתי הספר. אבל בניגוד להגיון הפובליציסטי הבריא (לפיו מספיק לרדת על הילדים-של-ימינו שלא יודעים מה ההבדל בין מפיק לדגש בשביל לזכות במאות טוקבקים אוהדים), רינה ברוך מביאה משב רוח רענן לדיון על מצב לימוד העברית (זעקת המורה ללשון, הארץ, 21/4/2013):

אילו התבקשתי לתאר את הבעיה על רגל אחת, הייתי אומרת כך: עומד לו המורה ללשון בכיתה ואומר לתלמידיו "שווא בראש המלה הוא שווא נע", ואת המלה "שווא" הוא מבטא פעמיים בשווא נח בראש המלה. וזאת מפני שתורת ההגה והצורות של העברית התִּקנית, הרִשמית, זו הנלמדת בשיעורי הלשון בבית הספר […] היא תורת ההגה והצורות של עברית המקרא […] ולא תורת ההגה והצורות של העברית שלנו, העברית הישראלית.

ויש המשך:

כלל נוסף מכללי הדקדוק הנלמדים בבית הספר: "צורת בינוני יחידה של פעלי ל"ה היא מלרעית: רָצָה, קָמָה בָּאָה וכו'. עוד שקר. הרי איש איננו מדבר כך, ואיש אינו קורא כך טקסט כתוב, גם לא המורה ללשון.

במילים אחרות, איך ניתן לדרוש מהתלמיד להתייחס לכללי השווא הנע בתור כללים אמיתיים, כשאנחנו בעצמנו אומרים shva ולא sheva.

ברוך מתארת יפה את חוקי ההגייה של העברית המודרנית, שלא יהיה ספק שמדובר במערכת שיטתית וקבועה. היא גם מצביעה יפה מאוד על ההבדל בין הכתיב וההגייה של העברית והמצב בשפה דוגמת אנגלית:

נכון שגם בלשונות אחרות הכתיב מייצג הגייה שכבר עברה מן העולם. באנגלית המלה knife (סכין), למשל, נהגית בלי העיצור k ובכל זאת כותבים בראש המלה את האות המייצגת אותו. אבל בניגוד לעברית, קרייני החדשות ברדיו ובטלוויזיה לא יהגו את המלה הזאת בצורתה העתיקה, ומשרד החינוך לא יכלול את הצורה העתיקה ב"תיקוני ההגייה" בחומר של בחינות הבגרות. הם מכירים בעובדה שה-k הזאת כבר מתה, והם נותנים לה לנוח על משכבה בשלום.

אין לי הרבה מה להוסיף על הטור הזה, בין היתר מפני שדברים דומים כבר נאמרו כאן (ואצל ידידינו) לא פעם. קריאה מומלצת ביותר.

Read Full Post »

מנהג קבוע הוא בבלוגנו להתלונן על כותבים עצלנים שמאשימים את השפה בכל חוליי החברה, כאילו השימוש במילה כזו או אחרת מטַפֵּש את הנוער או מצביע על הידרדרותנו המוסרית או מה שזה לא יהיה. ביד חזקה ובזרוע נטויה נזעקנו להגיב ולתקן, להסביר שצריך גם למצוא קשר בין סיבה ותוצאה, שזכותו של כל אחד לא לאהוב מילה מסוימת אבל שאי אפשר להכליל מכך על איזושהי תופעה חברתית מעורפלת.

אבל זה לא אומר שאין קשר בין שפה ותודעה, כפי שציינו בעצמנו. ד"ר עופר כרמי, למשל, כותב כך בבלוג של קופת חולים כללית על ההבדל ביחס שלנו לסרטן ולסוכרת:

שימו לב לרגשות שעולים כשאנחנו קוראים את המילה "סרטן". המעיים מתהפכים, נכון? רק מעצם אזכור המילה עולות במוחנו אסוציאציות איומות: מוות, סכנה, פחד וסבל. אבל האם באמת הסרטן שונה ממחלות מסכנות חיים אחרות? כל כך הורגלנו לחשוב שכן. כשמאבחנים אצל מישהו את ה"מחלה" (שפעמים רבות עדיין מקובל לא להזכיר את שמה המפורש, מפחד, שמא, ופן, וחלילה…) הוא מיד מתויג בתעודת הזהות הפסיכולוגית שלו ושל סביבתו כחולה שחייו נעצרו באחת. לכן על כולם להתגייס ל"מלחמה", שהרי כולנו כבר הורגלנו להכיר את האגודה למלחמה בסרטן.

אבל האם זה חייב להיות כך? ודאי שלא. זה הכול עניין של התניות תרבותיות.

לעומת זאת, חישבו כיצד אנחנו מתייחסים לסוכרת, למשל. בדרך כלל לא מבריאים מסוכרת, ומסרטן ניתן להבריא בשיעורים הולכים וגדלים. […] האם שמעתם פעם על "מלחמה בסוכרת" או על תיוגו של החולה בסוכרת מבחינה חברתית כ"חולה"? האם שמעתם פעם על "מחלים סוכרת"? לא ולא. אבל על "מחלים סרטן"? כן וכן. מדוע?

אין לי נתונים על הקשר בין אופטימיות וגישה חיוביות להבראה ממחלה, אבל חוכמת אנשים מלומדה היא שיש מתאם בין השניים ושגישה חיובית לתהליך ההחלמה אכן עוזרת. שוב – אני לא מכיר את המדע מאחורי הטענה הזה. כרמי ממשיך:

עולם המושגים שיצרנו סביב מחלת הסרטן פוגע בנו במקום לשרת אותנו. לקבוצת התרופות נוגדות הסרטן אנחנו קוראים "כימותרפיה", אף ששום תועלת לא צומחת מעצם השימוש במילה או מהזכרתה. נהפוך הוא. רק פחד וסבל. תארו לעצמכם שבכל פעם שהיינו רושמים אנטיביוטיקה לתינוק ורוד לחיים שחלה בדלקת אוזניים היינו אומרים לאם שאנו רושמים לו  תרופה נוגדת (אנטי) חיים (ביו). ברור שהיינו משתגעים.

מה הפלא אם כן, שהחולים חווים "תופעות לוואי" קשות? הבחילות וההקאות המפורסמות שאנשים מכירים בהקשר לטיפול הכימי (וכיום יש בידינו תרופות וטיפולים משלימים רבים המקטינים מאוד את שיעור הבחילות וההקאות ואת חומרתן), מתויגות ומוצגות כ"תופעות לוואי" שליליות המדכאות את מצב רוחו של "החולה", בעוד שהלכה למעשה הן ביטוי של חוכמת הגוף לריפוי!

כל בעל חיים, כולל האדם, שנחשף לרעל (והתרופות הכימותרפיות הן בסופו של דבר, רובן ככולן, רעלים) מנסה להיפטר מהרעל באמצעות הוצאתו מהגוף. זאת ועוד, ידוע שבחלק מהמטופלים בכימותרפיה, הבחילות וההקאות הן עניין של צפייה והתניה שלילית נלמדת.

[…]

גם תשישות, כמה שלא נעימה, היא לפחות אצל חלק מהמטופלים, בשלבים מסוימים, עדות לתבונת הגוף ולצורך שלו במנוחה בעודו טורח על שיקומו. אלא שמנוחה היא דבר שלא בא לבריות בחברה שלנו בקלות. קשה לאנשים להיכנע לתשישות. כשהם מגלים שאינם מסוגלים להתרוצץ כתמיד, הם מתנגדים לצורך להאט וחווים את התשישות כ"תופעת לוואי" שלילית, במקום להקשיב לגופם הזקוק לקצב החלמה אחר כביטוי לתבונת הריפוי שלו.

החיים והמוות, אם כן, ביד הלשון והתודעה.

אני לא יודע עד כמה כרמי מגזים לצורך הבעת המסר שלו, אבל הטענה הגיונית לטעמי: אוצר המילים שקשור לסרטן שונה מאוצר המילים המקובל לסוכרת, ועומד בסתירה ליחס בין סיכויי ההחלמה משתי המחלות. כמובן שצריך להתחשב גם בסבל היום-יומי שהמחלות השונות גורמות, אבל אין ספק שכחברה אנחנו מתייחסים לשתיהן באופן שונה מהותית. בנוסף, אם בחילות והקאות במהלך טיפול כמותרפי הן לפחות בחלקן תוצאה של התניה שלילית, הטענה של כרמי מקבל משנה תוקף.

נכון שכמו בטורים שסקרנו בעבר, גם כאן אין מספרים או נתונים אלא רק הערכות שבודה הכותב מליבו. אבל הפעם, בהתחשב בכך שהמציג הינו רופא ובכך שהקישור הלוגי בין הסיבה והתוצאה נראה לי יציב, יש כאן דוגמה טובה לכך שהשפה אכן עשויה להשפיע על התודעה – ואיתה, על הגוף.

Read Full Post »

לקח לי זמן עד שהאזנתי לנאום הבכורה של ח"כ מרב מיכאלי בכנסת, אבל טוב שעשיתי זאת משתי סיבות. הראשונה: מדובר בנאום מעולה ואני ממליץ לצפות בו בזמנכם הפנוי. השנייה: הוא עונה על שאלה ששאלתי את עצמי בעבר, והיא כיצד מדברים בעברית על privilege.

הכי קל להסביר את הכוונה באמצעות דוגמה. לא עוברות 20 שניות ומיכאלי מתארת את המקום שממנו נובעת הביקורתיות שלה: "המקום שבו מצד אחד אני חלק משושלת מייסדת, אבל מצד שני אני אישה. אמנם אישה פריבילגית, אמנם אישה שהיא הנכדה-של, אבל אישה." כלומר מיכאלי מודעת לזכויות-היתר שיש לה, אבל טוענת שהן לא צריכות להסיח את הדעת ממהות דבריה.

בשיח הליברלי/פמיניסטי המילה privilege משמשת לתיאור זכויות-היתר ששכבות מסוימות באוכלוסיה מקבלות, לרוב בכוונה לגברים לבנים [דוגמה]. בישראל השימוש במושג הזה נפוץ פחות, להתרשמותי, מסיבות שמעניין מאוד לדון בהן אבל לא על דפי בלוג זה. על כל פנים, תהיתי בעבר מה המונח בעברית, והנה מצאתי.

אני לא יודע אם בחוגים אחרים משתמשים במונח אחר אבל זה כנראה המונח המועדף על מיכאלי, משום שהיא משתמשת בו פעמיים נוספות: "לקחת אחריות על המקום הפריבילגי" (6:13), "המקום החזק והפריבילגי שלה" (6:55).

Read Full Post »

שני משפטים מוזרים במיוחד הגיעו לשולחני לאחרונה. הראשון מכיל רצף של כינויים רומזים מבלבלים והשני משתמש במטאפורה בלתי אפשרית.

כתבתו של אלי סניור בטמקא על הילדה הנעדרת אלכסנדרה ברנדט נפתחת (27/2/13) עם השורה התחתונה: "תעלומת היעלמותה של הילדה אלכסנדרה ברנדט לפני יותר מ-18 שנים טרם נפתרה". מה קרה בינתיים? ובכן,

לאחר שאמהּ של הנעדרת סירבה לערוך לעצמה בדיקת DNA, ערכו הוריה הביולוגיים של האישה שהאם טענה כי היא בתה שנעלמה ב-1994 בדיקות.

קראתי את המשפט הזה חמש פעמים ואני עדיין לא מבין לגמרי מי טען מה ומי קשור למי. ננסה לקודד בצבעים ונוסיף זוג סוגריים: לאחר שאמהּ של הנעדרת סירבה לערוך לעצמה בדיקת DNA, ערכו הוריה הביולוגיים של האישההאם טענה כי היא בתה שנעלמה ב-1994) בדיקות.

השאלה היא האם האישה היא אכן אלכסנדרה ברנדט הנעדרת, ומסתבר שהתשובה היא לא: "מהתוצאות שהתקבלה הבוקר (יום ד') עולה כי יש התאמה מלאה וזו בתם הביולוגית של זוג ההורים מאשדוד."

כן, אני כמעט משוכנע שאולי זו הכוונה. העיקר שדאגו לשים מפיק בה"א.

המשפט השני הוא הכותרת התמוהה לכתבה על שחיין שנטרף על ידי כריש (וואלה!, 27/2/13):

כריש טרף שחיין בניו זילנד: "הדם הציף את המים"

כך ממש, הדם הציף את המים. כיצד ניתן להציף מים, אינני יודע, ונראה שמישהו נסחף קצת עם המטאפורות. ניסיתי להתחקות אחר המקור באנגלית אבל לא הצלחתי למצוא משהו דומה.

[ת' לגלעד וליאיר]

Read Full Post »

הערת שוליים לעניין עבודות הדוקטורט שנכתבות באנגלית באוניברסיטה העברית, אותו סקרנו לאחרונה. שרת התרבות היוצאת לימור לבנת התייחסה אתמול לעניין בכנס 'לשון ראשון'. ואם שרת התרבות מתייחסת לנושא כזה, ועוד בכנס ראש הממשלה ללשון, כמובן שבלוגנו יתייחס לכך בכובד הראש הנדרש. כך פותחת לבנת את דבריה, לפי הכתבה בוואלה:

אנו מדברים הרבה על הדרת נשים, ובצדק. אבל חשוב לא פחות לדבר על הדרת העברית.

לא. את טועה. כאן הפסקתי לקרוא וזהו.

Read Full Post »

זה יהיה פוסט קצר, כי כמה כבר אפשר לדבר על התבטלות העברית בפני האנגלית? (טוב, זה תלוי אם צריך לפרסם כתבה או לא)

נשיא האקדמיה ללשון, פרופ' משה בר-אשר, מקונן על החלטת האוניברסיטה העברית לפיה ניתן להגיש מעתה עבודות דוקטורט גם באנגלית ולא רק בעברית.

"מכאן ואילך מנסחים תקנון חדש ובו הקביעה: 'עבודת הדוקטור תוגש בעברית או באנגלית'. ובזה בא המוסד הנכבד הזה כמו להודיע שחל פיחות במעמד העברית בו. הרי ברור שבלי משים החלטה גוררת החלטה ותקנה גוררת תקנה, ובסופו של דבר יגבר הלימוד באנגלית והתהליך הזה יגרור גם הוראה באנגלית בבית הספר היסודי ובתיכון". הוא שיגר מכתב לחברי הסנאט באוניברסיטה העברית, ובו מחה על ההחלטה לשנות את סעיף התקנון לתלמידי המחקר.  

שום דבר חדש בינתיים. אבל בין נימוקיו של בראשר ההכרזה הבאה:

"אנשים אינם אומרים 'שלום' ו'להתראות' אלא 'הי' ו'ביי'. אנו מושכים בידינו תרבות בת יותר מ-3,000 שנה שהתנהלה תמיד בעברית, גם כשדיברו לשונות אחרות. יש ברשות הרבים סחף במעמדה של העברית, ומי שהעניין הזה יקר לו צריך לעמוד על כך. אני לא מדבר על שוטרי לשון, אלא על אוהבי לשון ושוחריה שצריכים להסביר את הערך התרבותי של הדבר הזה".

לא הבנתי. מה זה אומר שהתרבות "התנהלה תמיד בעברית, גם כשדיברו לשונות אחרות"? איך זה עומד מול העברית היהודית מחד גיסא והיידיש מאידך גיסא? הארמית? הרוסית? ואיזה נזק נגרם עתה כשפרופ' בר-אשר השתמש במילים אלא (שאילה מארמית) ושוטר (שאילה מאכדית), אינני יודע.

והכי חשוב, שבסוף הכתבה מופיע הקישור Read this article in English.

Read Full Post »

אנקדוטות אחרונות לפני הבחירות:

  • חברנו אא"א חיבר לא מזמן מילון מקוצר למונחי פוליטיקה ישראלית. יש לי כמה דברים לומר על זה, אבל עד שאכתוב על זה רשומה בטח יקדימו כבר את הבחירות הבאות.
  • סיפור מוזר במיוחד קרה עם קליפ לשיר של הזמר מקס פינק: שיר על בחירות הפך לתשדיר תעמולה אינטרנטי של רשימת מפלגת כלכלה, שהדביקה עליו כתוביות משלה, תמונות של בכיריה ואת הפתק שלה בקלפי. ברשימה עצמה מכחישים וטוענים שמישהו אחר עשה את זה. בכל אופן, הנקודה הלשונית המעניינת היא שבפזמון פינק שר "תבחרו בי" וחוזר על "בי" עוד כמה עשרות פעמים. בשלב הזה הפתק של כלכלה — שאותיותיה פי — מהבהב על המסך.
    הצלילים בּ' ופּ' דומים מאוד (דוברי ערבית רבים משתמשים ב-בּ' משום שבשפתם אין את הצליל פּ'): שניהם מופקים באמצעות הפרדת השפתיים ונשיפת אוויר דרכם, רק ש-בּ' מרעידה את מיתרי הקול יותר (נסו ללחוש בּ' ותקבלו פּ'). פונטיקאים מסוגלים לכמת את המעבר מפּ' לבּ' כפונקציה של פרק הזמן שחולף בין נשיפת האוויר והרעדת מיתרי הקול. רוצה לומר, ההבדל בין בּ' ל-פּ' אינו מוחלט, וזה מה שגורם לאחד להישמע כמו השני לפעמים ולטריק של הסרטון המעובד להצליח. (עוד על פונטיקה כזו כאן, בניתוח שורה משיר של יהוא ירון)
  • סיפור נוסף שצץ אתמול נוגע ליאיר לפיד. לפיד הואשם שכמעט וקרא לאנשי ש"ס 'פרענקים', אבל הוא טען בזחיחות מה שהוא בכלל התכוון להגיד "פרגמנט". סקירה ממצה תוכלו למצוא כאן. האמת היא שאין לי משהו מיוחד לומר בעניין הזה וגם לא ניתוח פונטי מועיל. אני דווקא מאמין ללפיד בנקודה הזו, אבל לא אבזבז עליו ספקטרוגרמות.

וזהו, לכו להצביע מחר. עדיף להצביע לטובים, אבל גם אם לא, העיקר להצביע. וכשתחזרו מהקלפי, מרוצים שמילאתם את זכותכם וחובתכם הדמוקרטית, תוכלו ליהנות מרשומה משעשעת במיוחד שתופיע כאן לסיום עונת הבחירות.

Read Full Post »

Older Posts »