Feeds:
פוסטים
תגובות

Archive for the ‘פרגמטיקה’ Category

בעבר הרחוק, כשהארץ רחשה ובחשה סביב חוק השואה הפולני (זוכרים במעומעם משהו כזה?) נקלעתי לציוץ חצי אוף-טופיק של רועי עידן:

התאמבוולנטי כהלכה. אני חושב שיש כאן כמה תופעות לשוניות אפשריות, וכל אחת מהן אפשר לקחת בדיוק למסקנה הפוכה לגבי מטרות הפרסומת. עליי לציין שלא שמעתי את הפרסומת עצמה וייתכן שהאינטונציה מצביעה לכיוונים מסוימים ומבטלת אחרים, אז אם מישהו.י שמע.ה, אשמח לשמוע בהתגובות.

אם כן, נמנה:

  1. הראשונה היא הפרשנות של אדון צ'וריסו – "הנאצים" מתפקד כאן כביטוי תוארי מצמצם, כמו ש"הבתים הכחולים" לא מתייחס לכל הבתים אלא רק לחלקם, אלה שצבועים כחול. המסר שעובר כאן היא שמחברי הטקסט אכן מאמינים שלא כל הגרמנים היו נאצים וחשוב להם להבהיר את זה.
  2. פרשנות שנתן נתי טוקר בתגובה להציוץ היא שמטרת הביטוי השלם היא למקם אותו בזמן – הגרמנים בתקופה שבה הם היו נאצים (וזה מתאים לתפיסה שמשמעויות שתי המילים מתלכדות עבור התקופה האמורה), בהקבלה להביטוי "גרמניה הנאצית". עידן עונה לו "אז למה לא פשוט אומרים 'הנאצים', כולם יודעים מי הם היו?", שבעיני מקהה מהטיעון המקורי – אולי כולם יודעים, אבל שווה להזכיר, לא? אם היו אומרים רק "הנאצים" עוד היית אומר שמטשטשים את זהותם הלאומית, ואז כנראה גם ממשלת פולין היתה מגייסת אותך להסברה.
    עוד נקודה חשובה בפרשנות הזאת היא שהיא מונעת אי-הבנה לגבי מתי צולמו הצילומים – "הגרמנים" סתם יכולים להיות גם הגרמנים שאחרי המלחמה (ככל שהיה עוד מה לצלם במחנות הריכוז אחרי המלחמה). במאמר מוסגר, "הנאצים" לא באמת יכול להתייחס למישהו מתקופה אחרת, שכן צילום של מחנות הריכוז נתפס כמשהו שמתבצע מצד הגוף בעל הסמכות במקום (ולא, נאמר, ניאו-נאצים חובבי צילום בשנים מאוחרות יותר).
  3. מה שמוביל אותנו לפרשנות אפשרית אחרת, והיא דווקא שמדובר במעין מבנה תמורה (לא קלאסי כי לא צריך הפוגה, פסיקים), על משקל "הנאצים יימח שמם". כאן הקו של עידן אמור להיות הכי מרוצה, כי מתבצעת פה השוואה מוחלטת – הגרמנים הם הנאצים (או, לפחות, היו בתקופה הרלוונטית) ואין מה לבוא בטענות ליד-ושם.
  4. עוד נקודה היא שיש נופך, נאמר, לא-מקצועי בביטוי "הנאצים" לבדו. זה נשמע קצת שיחת-סלוני מדי, או קצת לא מתייחס לרפרנט המילולי שלו (ע"ע "השופט הזה, איזה נאצי"). לפי הגישה הזאת, מטרת השימוש בביטוי השלם היא דווקא להעניק כובד ראש לנושא המדובר.

בקיצור, הבו לי פוזיציה וארים איתה את העולם.

Read Full Post »

באזור הדמדומים שבין תל-אביב לגבעתיים נתקלתי בפוסטר הבא:

wpid-20150105_102011-1.jpg

שומר נפשו יו!

נתקלתי ונאלמתי דום, משום שלא הבנתי מה הקשר בין השאלה לתשובות. למעשה, לא הבנתי האם ועד כמה דיסקונט גנבים. אסביר.

הכרזה מכריזה: "סקר לציבור הרחב יקבע האם דיסקונט גנבים?" ומבקשת "סמן X לתשובה הנכונה". עקרונית סימן השאלה מיותר, שהרי מדובר בציטוט עקיף, אבל לא נורא. מה שחשוב הוא שעל פניו, יש לנו עסק עם שאלת כן/לא: או שדיסקונט גנבים, או שדיסקונט לא גנבים (יש טיעונים לכאן ולכאן, ומכיוון שאנחנו בלוג הבלשנות דגש קל ולא בלוג הבנקאות כסף קל לא ניכנס אליהם).

אלא שהתשובות האפשריות הן:

(1) הרבה מאוד גנבים
(2) המון גנבים
(3) רק גנבים
(4) כל התשובות נכונות

בואו נראה מה בעצם אומרות התשובות האלה. (3)-(1) הן קביעות לגבי כמות הגנבים מתוך עובדי בנק דיסקונט וכולן מעלות את השאלה הבאה — מה אחוז הגנבים מתוך כלל עובדי בנק דיסקונט כך שהתשובה תהיה נכונה? למשל, ניתן להניח שאם 20% מעובדי הבנק הם גנבים, זה אחוז שערורייתי. במקרה כזה גם (1) וגם (2) נכונות. למעשה, לא ברור מתי יש הבדל בין (1) ל-(2): מה בעצם ההבדל בין הרבה מאוד ל-המון? רק עניין של משלב?

את (3) קל יותר לכמת: 100% מהעובדים צריכים להיות גנבים כדי ש-(3) תהיה נכונה. ברגע שעובד אחד אינו גנב, אי אפשר לומר שבדיסקונט עובדים רק גנבים.

תשובה (4) אפשרית ומהווה דוגמה למה שנקרא אימפליקטורה סקלארית: אני יכול לומר שבדיסקונט יש הרבה מאוד או המון גנבים, בהתאם לתשובות (2)-(1) — ואז תחשבו שיש אולי 20% או 60% — אבל להמשיך ולומר "בעצם, כולם שם גנבים" בהתאם לתשובה (3). לא ממש סתרתי את עצמי: כשאמרתי שיש "הרבה" גנבים (20%) השתמע שאין מספיק בשביל "רק" (100%), אבל המשכתי על הסקאלה עד שהגעתי ל-100% של "רק".

עד כאן הכל טוב ויפה, הבנו מה ההבדלים בין התשובות השונות ואפשר לעצור כאן. אבל לי עלתה מחשבה אחרת: שאנחנו בכלל לא מדברים על כמות כאן, אלא על אופן או מידה. במילים אחרות, השאלה היא לא "כמה מעובדי בנק דיסקונט הם גנבים", אלא "אנחנו יודעים שהבנק הוא ישות גנבה, עכשיו בואו ניתן לגנבוּת שלהם ציון". הפירוש הזה מתאים יותר לשאלה המקורית בכרזה, ופרגמטית נראה לי שזו היתה הכוונה. הבעיה היא שזו תחושת בטן שקשה למצוא לה סימוכין. דמיינו שהשאלה היתה "האם דיסקונט הגונים?" והתשובות האפשריות היו:

(5) מאוד הגונים
(6) נורא הגונים
(7) הכי הגונים
(8) כל התשובות נכונות

תשובות כאלה אפשריות מפני ש-הגון הוא שם תואר (או שם עצם, תלוי) שאפשר להגביר באמצעות תארי פועל כמו מאוד, נורא, ממש, קצת וכן הלאה. אם ננתח כך את "גנבים" ניאלץ לומר שני דברים. ראשית, ש-גנב הוא שם תואר במקרה הזה, ושנית, ש-הרבה מאוד, המון ו-רק יכולים לשמש כתארי פועל. מתחשק לומר שהראשון לא נכון והשני לא יהיה, אבל בואו נראה.

לא יהיה בעייתי מדי לפרש את גנב בתור תכונת אופי, להבדיל ממקצוע. השאלה היא אם יש סקאלה של גנבוּת. שוב, תחושת הבטן שלי היא שכן אבל לא מצאתי דוגמאות טובות ברשת. לגבי הנקודה השנייה, גם הרבה מאוד וגם המון אפשריים כלוואי לשמות תואר בעברית עכשווית. ההדגשות שלי:
"עצוב וזהו. הרבה מאוד עצוב, בלי עצות, בלי השגות, בלי "אבל מה עם…?". ככה. זה מה יש." [מקור]
"ראיתי אתמול את ההקרנה (לנשים, אצלנו הגבילו כניסה מגיל 18). מטלטל, עוצמתי, מרגש (והמון המון עצוב), ובעיקר יוצק אמונה בכמויות." [מקור]

חיפשתי בינתיים רק עם התואר עצוב ויהיה מעניין לראות אם התופעה מתפשטת לתארים אחרים (עוד על שילובים מפתיעים בין שמות ולוואים כאן וכאן). השורה התחתונה היא שאפשר לדעתי לומר על אדם מסוים שהוא לא סתם גנב, הוא המון גנב או הרבה מאוד גנב או קצת גנב. אני חושד שזה הרעיון שניסוי להעביר בכרזה, אבל בגלל שעדיין מדובר בשימוש לא נפוץ בשפה, קשה לי להגן על הניתוח הזה כרגע.

אז מה המסקנה מכל הדיון הזה לגבי סקאלות ותארים? הכרזה מכמתת גנבים או מאייכת גנבוּת? כל התשובות נכונות.

Read Full Post »

הקורא הנאמן (כאילו יש בכלל מה לקרוא פה בזמן האחרון, עונת מלפפונים לפנים) דן (יותר מסתם קורא: הוא הבוס!) העיר את תשומת לבי (מה ארבע מילים רצופות בלי סוגריים מה) לביטוי מוזר שהולך ורוחש בעולם המושגים המלבב שנקלענו אליו בחודשים האחרונים: מַשגר פצמ"רים. הרי האקזמפלר:

majger
והרי כמה נוספים. יש גם דוגמאות רבות היכולות להיקרא כאדם מבצע הפעולה (מְשגר פצמ"רים), אבל גם זה אינו ביטוי הכרחי.

מה הבעיה בעצם? ובכן, פצמ"ר הוא ראשי תיבות של "פצצת מרגמה". פצצת מרגמה, מעצם שמה, נורית מתוך מרגמה. למיטב הבנתי, אפילו מבחינת דקדקנות טרמינולוגית צבאית אין משגר פצמ"רים שאינו מרגמה, שכן זהו פשוט השם לקטגוריית כלי הנשק היורים פצצות פשוטות באופן תלול-מסלול מעמדה נייחת. לראיה הדוידקות ממלחמת השחרור, שלא היו כלי תקני אך נחשבות למרגמות. בקיצור, הביטוי אינו טבעי בערך כמו "מַרסס כדורי מקלע". מותר להתפלא מהעובדה שהדוגמה לעיל לקוחה דווקא מאתר רשמי של צבא ההגנה לישראל, ושהביטוי מופיע גם בסרטוני דובר צה"ל.

איך הגיח הביטוי החריג ללשוננו? המסלול כנראה קל לשחזור, לא בשונה ממסלול הפצמ"ר עצמו (ברכות יובל, זכית בפרס הקישור הנושאי חסר הטעם בהבלוג לשנת תשע"ד). סוג הקליע יוצא-עזה שזכה למירב תשומת הלב בשנים האחרונות הוא הרקטה. רקטה אכן יורים ממשגר. כשנכנס לתמונה הרכיב האנלוגי למשגר של פצמ"ר, מתבקש לקרוא גם לו משגר. שמו האמיתי מתחבא בתוך ראשי תיבות, ועוד ראשי תיבות שלא משמרים את התנועות של המילים המקוריות (פְּצצת או פִּצְצת? זה לא משנה, בראשי תיבות הוגים /pa/) או את המין הדקדוקי של הביטוי המקורי, ולכן קל לשכוח שבכלל מדובר בראשי תיבות. תוסיפו את העובדה שאין עוד דוגמאות נפוצות לקליע שגוזר את שמו מהנשק ממנו הוא נורה (כדורים מקוטלגים לפי מידה, פצצות מוטסות לפי משקל, רקטות וטילים נושאים לרוב שם ייחודי) ונקבל עילה סבירה למחילה על חוסר-הזהירות. (אגב, בהמשך להערה שמתחת לתמונה – האדם המשגר נקרא רגם).

ומה השם המתאים לתופעה? סקרנו כאן בעבר תופעות לא בלתי-דומות לדבר הזה. היה לנו את התי"מ המיותר, גם שם כיכב הצבא בדוגמאות (המוכר ביותר הוא ככל הנראה סס"ל לבן, כאשר ה-ל בראשי התיבות מסמנת בעצמה "לבן"). לא בלתי-דומה, אבל לא זהה: בתי"מ מיותר קיים אלמנט שחוזר על עצמו בשתי צורות (בתוך ראשי תיבות או מילה קפואה ובתור המילה הרגילה), אבל כאן כל הביטוי כולו זהה במשמעותו לחלק מתוכו. שזה יכול להזכיר סינקדוכה (לא לבלבל עם הכינוי הנפוץ לאקדוחן סיני), התופעה שבה חלק מייצג את השלם או להפך (כשאומרים "אמריקה" ומתכוונים לארצות הברית של אמריקה; בעבר היה מקובל לומר "רוסיה" ולהתכוון לברית המועצות), אבל כאן יחסי החלק-שלם מתייחסים לביטויים הלשוניים ולא לישויות המיוצגות על-ידם. אז שלחתי מייל בהול בנושא לג'ף פולום, אבל אפילו הוא אבד עצות. אז אם בספינת האם נפלה שלהבת, זה הזמן של אזובי הקיר להמציא מונחים! ובכן, התופעה הכי קרובה שהצלחתי לחשוב עליה באיזושהי רמה של אנלוגיה היא גזירה-לאחור: יש לנו מילה שנראית כמו תוצר של הטיה, אפילו שהיא לא. נאמר פָּנים או שוליים. אם נחליט שיש לה צורת בסיס, כמו פן או שול בהתאמה, נסתדר כבר עם להתאים לה משמעות. אז במקרה שלנו, מדובר על צורה שהיא כן תוצר של פעולה לשונית (אבל לא בדיוק גזירה. "ראשי-תיבותיזציה"?) ובמקום לגזור אותה לאחור, גוזר אותה הדובר "לפנים". ממש כמו במשחק הדמקה! ובכן, חברים חברות, עוקבים ועוקבות, חברי האקדמיה, אני מתכבד בזאת להכריז על המושג גזירת-דמקה, שמצטרף לחבריו הגאים סתירונים, תי"מ מיותר, עצטרובל, סנובון, ובטח עוד כמה ששכחתי. [עדכון, 26/11: משאול!]

עם תמונת נצחון זו נסיים. הפסקת אש בלתי-מופרת שתהיה לכולנו.


רפרנס כותרת למי שפספס. ביזיון שאין את המילים בשירונט, או קליפ ביוטיוב שאינו בביצוע אסי כהן.

Read Full Post »

אורה פלד נקש ספק-שואלת-ספק-מלשינה בקו החם של טוויטר: "יואל מרקוס נופל בפח השלילה הכפולה?". כך כתב מרקוס כשנכנסו לטהר ויצאנו מטוהרים (ההדגשה שלי):

2. כל אימת שאנו מצויים בעימות צבאי, נוצרת אותה בעיה: אנו יודעים איך מתחילים, אך לא יודעים איך יוצאים. או שיוצאים מוקדם מדי ולטווח קצר מדי. דבר אחד צריך להיות ברור הפעם. א': לא יוצאים מעזה בלי שאנו יודעים בוודאות שלא נוטרלה אחרונת המנהרות. ב': צריך לפעול למען פירוז עזה מטילים. יש נטייה לשכוח שעזה אינה ישות עצמאית, אלא מפלגה־תנועת טרור בשם חמאס, שהשתלטה על חלק מהטריטוריה הפלסטינית. האם מישהו מעלה בדעתו, שאופוזיציה כלשהי, בצרפת למשל, היתה תופסת טרירטוריה מסוימת ומשליכה את שוטרי הרפובליקה מהגגות ומשתלטת כך על חלק מהמדינה?

אורה מתכוונת לתופעה המתסכלת שבה מרוב שלילות לא רואים את היער. לתופעה הזו אפשר לקרוא שלילה כפולה או שלילה שגויה והיא תועדה יפה על ידי עמיתיי לבליגה (במיוחד פינטר) שתיעדו יותר שלילות כפולות מאשר יש לנו מלחמות בעזה.

שלילות רבות ומרובות מתקילות את מרקוס בפיסקה הזו, משל היו שאלות על המצב שמופנות לראש הממשלה במסיבת עיתונאים דמיונית. ובכן. למה התכוון המשורר? טוב, ברור למה הוא התכוון: שהתנאי ליציאה מעזה הוא כזה — אין יותר מנהרות. טיהרנו את כולן. אבל האם זה באמת מה שמרקוס כתב? בואו נבדוק. העניין מסובך במיוחד משום שיש כאן שתי פסוקיות: זו שמתארת מה שאנחנו יודעים, וזו שמתארת את מה שקרה בשטח.

יוצאים כשיודעים בוודאות שנוטרלה אחרונת המנהרות – יוצאים מעזה אחרי שווידאנו שהמנהרות נוטרלו כולן.
יוצאים בלי שאנו יודעים בוודאות שנוטרלה אחרונת המנהרות – יוצאים בלי לוודא שהמנהרות מנוטרלות.
לא יוצאים בלי שאנו יודעים בוודאות שנוטרלה אחרונת המנהרות – יוצאים אחרי שווידאנו שהמנהרות נוטרלו כולן.

אבל עכשיו, חזיז ורעם, צצה לה שלילה בפסוקית המשועבדת.
לא יוצאים בלי שאנו יודעים בוודאות שלא נוטרלה אחרונת המנהרות – יוצאים אחרי שווידאנו שהמנהרות לא נוטרלו כולן.

כמעט! אבל שלילה אחת מיותרת הביאה למשמעות הפוכה. לא נורא, ננסה שוב בשנה הבאה.

[ת' לאורה]

Read Full Post »

אח, שלילה כפולה. ומשולשת ומרובעת. הלא-קרם-דה-לה-לא-קרם של טעויות הסמנטיקה.

צפו-צפו נא בהעלאת הגרה העונתית של המקור. הופסלך, כבר בדקה 2:07 מתחיל רזי ברקאי לשאול:

לא הגיע הזמן שהגוף הזה לא יהיה מבוקר כמו גופים אחרים?

בטוחני כי כל הצופים הבינו בדיוק למה רזי מתכוון. הוא פשוט לא התכוון לומר את ה-"לא" השני. איכשהו זה עובר חלק. מוחות הקוף האומללים שלנו עד כדי כך מתחסרי ישע כשמשפט טיפה מסובך מגיע אליהם, שכל הסמנטיקה נזרקת הפחה והפרגמטיקה הופכת לסמכות הבלבדית של מה-הרגע-אמרו-לנו. אני חושב שאני בעצמי שמתי לב לזה רק כי יש לי טריגר מיוחד לשלילה כפולה, שמופעל כשאני שומע פעמיים "לא" בקרבה מעוררת חשד.

כי המסך לא יצלם את עצמו

כי המסך לא יצלם את עצמו

מימונה שמחה לכל!

Read Full Post »

[בלה פוסט אורחת בלה גבי סטנובסקי בלה סטודנט לבלשנות בלה באוניברסיטת בת בלה]

לאחרונה נתקלתי ברשת במספר אלגוריתמים לשוניים מעניינים ומוזרים שהוצעו בשפה האנגלית. עניין אותי לנסות ולשחזר אותם עבור השפה העברית. רשומה זו סוקרת את האלגוריתמים, את הכלים החישוביים אשר נעשה בהם שימוש, ומספקת מקבילה עברית שלהם.

NURBLE

במקור

מן הקומיקס המעולה SMBC של הכותב והמאייר זק ווינר (Zach Weiner). בקומיקס מועלים לא פעם רעיונות מתחומים רבים, חלקם דמיוניים לחלוטין, וחלקם מתבררים כפרקטיים למדי.

באחד הקומיקסים הכותב העלה את הסברה כי ניתן לשפר טקסטים פוליטיים ע"י שינוי כל מילה שאינה שם עצם ל-NURBLE. עוקב טוויטר חרוץ לא איחר להגיב עם תוכנה קטנה שעושה בדיוק את זה – מקבלת טקסט, ומחזירה אותו "מנורבל".

הרעיון לא חמק מעינם של הכותבים של לאנגואג' לוג, אלו התייחסו בפוסט שבו הוצעו מספר "מנרבלים" נוספים.

איך זה נעשה

התוכנה הקטנה ששלח העוקב (שנכתבה בשפת PHP) עושה שימוש במשאב חיצוני – קובץ המכיל מאגר מילים וחלק הדיבר שלהם. התוכנה עוברת מילה-מילה על הטקסט אותו יש לנרבל, ובודקת לפי המאגר האם המילה היא שם עצם או לאו – בהתאם היא מחזירה Nurble, או את המילה עצמה.

התוצאה

מעניינת ומשעשעת למדי, ניתן להתרשם באותו הקומיקס מהרצה של האלגוריתם על נאום המצב לאומה של אובמה. באופן מפתיע ניתן להבין את רובו, גם כאשר הרוב המוחלט של המילים "מנורבל".

בעברית

כפי שראינו התוכנה המקורית עשתה שימוש במאגר מילים ממשאב חיצוני. למיטב ידיעתי משאב שכזה לא קיים בשפה העברית. בנוסף, כנראה שנטייתה של השפה העברית לעמימות תחבירית יקשה מאד על שימוש במשאב כזה, גם אם קיים. מסיבות אלו נעשה שימוש במתייג – פונקציה אשר בקבלת משפט מחזירה, בין השאר, את חלקי הדיבר של מילותיו (עוד על כך בהמשך) באחוזי ההצלחה מסוימים. בהינתן פונקציה כזו הפתרון למשימה נעשה טריוויאלי – נעבור על כל המשפטים בקלט, נזין אותם למתייג, ונברור את שמות העצם מתוכם.

התוצאה

התרשמו בעצמכם מ"נירבול" נאומו של יאיר לפיד במליאה:

מקור, ולאחר נירבול.

עינכם הרואות – ה"נארבל" עשה עלייה ל-"בלה", לדעתי גם במקרה הזה ניתן להבין את המסר בקווים כלליים.

נסו בעצמכם

אם אתם מעוניינים לבדוק בעצמכם את ההשפעה של הנירבול על טקסטים אחרים, העלתי מדגים של התוכנה (לאחר הכנסת הטקסט, סמנו את האופציה NURBLE).

אתנחתא – מתייגים, מפיגי עמימות ומודלים סטטיסטיים

בתחום הבלשנות החישובית קיימים מספר תחומים ובעיות אשר נחקרו רבות בשנים האחרונות – רובן בעיות בסיסיות אשר פתרון שלהן יהווה בסיס כמעט לכל מערכת אשר רוצה לעשות שימוש בשפה טבעית. בין אלו ניתן למצוא: תיוג חלקי דיבר (Part Of Speech Tagging), זיהוי ביטויים שמניים (NP Chuncking) וזיהוי ישויות (Named Entity Recognition). קל לראות כי אלו הן אבני הבסיס למשימות "מורכבות" יותר, דוגמת ניתוח תחבירי (Parsing), תרגום מכונה, סיכום אוטומטי, ועוד.

בניגוד למשימות ה"מורכבות", במשימות בסיס אלו קיימת לרוב הסכמה בין דוברי השפה לגבי הפלט הרצוי. כך, כל דובר שפה עברית יסכים כי חלק הדיבר של המילה "רץ" במשפט "גל רץ הביתה" הנו פועל (Verb), בעוד שספק אם קיימים שני אנשים שונים אשר יסכמו את הרשומה הזו לכדי אותו סיכום.

כמובן שבעיות אלו הנן תלויות שפה עד מאד, והאלגוריתמים אשר מנסים לפתור אותן חייבים להתייחס למאפייניה הייחודיים של השפה אליה הם מכוונים פתרונן. למשל אופייה הצירופי (word agglutination) של השפה העברית עלול להקשות רבות על כותבי אלגוריתמים כנ"ל לשפה העברית – אלגוריתמים אלו צריכים להפיג את העמימות באשר היא קיימת לגבי המילים במשפט. אם נסתכל שוב על המילה "רץ" הפעם במשפט "גל הזיז את הרץ למשבצת הסמוכה", ברור כי יש להתייחס למילה רץ בתור שם עצם, בניגוד לפועל שראינו במשפט לעיל – אלגוריתמים אלו יצטרכו לבחור את הפירוש הנכון למילה בהינתן ההקשר המתאים. [ראו גם כאן וכאן – א"ק]

המגמה הבולטת בשנים האחרונות לתקיפת בעיות אלו היא גישה הסתברותית (סטוכסטית). ניתן לייחס זאת להתחזקות כוח המחשוב, לקורפוסים העצומים והבלתי מעובדים (unstructured corpora) של שפה טבעית שמשתמשי האינטרנט מייצרים על בסיס יומיומי, ולאכזבה כללית ממודלים דטרמיניסטיים ו-"שלמים" יותר שהוצגו בעבר.

אלגוריתמים הנוקטים בגישה זו מניחים קיום של מודל כלשהו אשר ממנו מופקים משפטים תקינים בשפה או שבעזרתו ניתן לנתח משפטים בשפה טבעית. כך לדוגמא רשתות נוירונים מניחות קיומו של מודל המפשט את המוח האנושי לכדי נוירונים אשר מופעלים לפי פונקציות הפעלה מסוימות (activation function), ומודלי מרקוב חבויים (Hidden Markov Models) מניחים קיומו של מודל של מכונת מצבים, אשר המעבר בין המצבים תלוי במשפט הקלט ובהסתברות מסוימת.

מודלים אלו נמצאים בבסיס האלגוריתמים הסטוכסטיים. אופיינית, אלגוריתמים אלו יתחילו מתהליך של "אימון" על משפטי קלט משפה טבעית. תהליך זה מטרתו לכייל את הפרמטרים אשר מוטבעים במודל. כך ברשתות נוירונים יכוילו המשקלים אשר ניתנים לכל נוירון, ובמודלי מרקוב חבויים תכוילנה ההסתברויות למעבר בין המצבים.למעשה ניתן לומר כי תהליך האימון מתאים את המודל למשימה הספציפית מולה ניצבים.

לאחר שלב האימון, מפסיקים לכייל את הפרמטרים של המודל ומציגים בפניו משפטים שלא חזה בהם בשלב האימון. בתקווה, המודל אכן יודע להכליל איזושהי תחזית לגבי כלל המשפטים בשפה (או בחלק נרחב ממנה), ולכן יוכל לתת תשובות באמינות מסוימת גם עבור משפטים שלא ראה בעבר.

חלק מן החכמה בכתיבת מערכות שכאלו כוללת את בחירת המודל, אפיון הפרמטרים שלא ישתנו במהלך האימון (לדוגמא, טופולוגיית הרשת במקרה של רשתות נוירונים), ובחירת המאפיינים (features) שיהוו קלט למודל הנבחר.

עבור מימוש שני האלגוריתמים הפשוטים יחסית שמתוארים ברשומה זו, עשיתי שימוש במתייג ומפיג העמימות שנכתב על ידי מני אדלר מאוניברסיטת בן גוריון. משפטים שלמים מן הקלט מוזנים אליו, ובתמורה מקבלים עבור כל מילה בין השאר את חלק הדיבר שלה (בו כבר עשינו שימוש עבור אלגוריתם NURBLE) את הבניין, הזמן, המין, הגוף, ואת צורת הריבוי שלה – בכל אלו נעשה שימוש באלגוריתם הבא שיתואר.

Jailbreak the Patriarchy

במקור

במקרה הזה מדובר בתוסף לשוני מוזר לדפדפן chrome שמתיימר לשבור את הפטריארכיה השלטת ברשת.

התוסף מחליף בטקסט דפי האינטרנט שמות גוף זכריים לנקביים ולהיפך. בנוסף הוא מחפש ביטויים זכריים מסוימים ומחליף אותם במקבילה הנקבית שלהם, ולהיפך. כך לדוגמא "he loved his mother very much" יהפוך ל-"she loved her father very much" ו-"the patriarchy also hurts men" יומר ל- "the matriarchy also hurts women".

איך זה נעשה

לפי תיאור התוסף, נראה כי מדובר במשימת "חפש-החלף" פשוטה יחסית: התוסף עובר על הטקסט בדף, ומחפש ביטויים שנקבעו מראש. ברוב המשפטים אכן מושגת החלפת מין (gender swapping, לפי הכותב), זאת מכיוון שרוב חלקי הדיבר בשפה האנגלית הם ניטרליים מבחינת מין.

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

בעברית

בדומה לאלגוריתם הקודם, נראה כי הגישה שננקטה במקור לא תספק מענה הולם בעברית. נסתכל על הדוגמא שנתנה בחלק הקודם:

  • גל רץ הביתה.
  • גל הזיז את הרץ למשבצת הסמוכה.

נניח כי נבצע משימה של חיפוש והחלפה, ונרצה להחליף את "רץ" ב-"רצה", נקבל:

  • גל רצה הביתה
  • * גל הזיז את הרצה למשבצת הסמוכה

ברור כי זוהי אינה התנהגות רצויה, וכאמור, בשפה האנגלית לרוב לא נתקלים בקשיים שכאלו.

הדרך בה נקטתי לפתרון הבעיה הנה שימוש במתייג שהוזכר לעיל – ממנו דליתי עבור כל מילה בקלט את חלק הדיבר שלה, בהתאם הפעלתי עליה פונקציית החלפת מין. אתאר את הפונקציות עבור חלקי הדיבר שם-גוף ופעלים:

שמות גוף:
בהינתן הידע כי מילה מסוימת היא שם גוף, והעובדה כי שמות הגוף היא קבוצה סגורה וקטנה יחסית של מילים, ניתן להשתמש בטבלה פשוטה ולהמיר "הוא" <-> "היא", "הם" <->"הן" וכיו"ב.

פעלים:
בהינתן הפרמטרים הבאים עבור מילה: בניין, זמן, מין, גוף, ואת צורת הריבוי שלה. ניתן להשתמש בחוקי התחביר העברי, לגזור את השורש ולשתול אותו במקבילה הנקבית / זכרית.
בנוסף לאלו, הכנסתי גם רשימת ביטויים בעלי מין אותם האלגוריתם מחליף, בדומה לתוסף המקורי – "אמא" <->"אבא", "פטריארכיה" <-> "מטריארכיה" ועוד.

התוצאה

מעניינת, אך רחוקה מלהיות מושלמת. אם להמשיך באותו קו של דוגמאות, בחרתי את פוסט הפייסבוק שמשום מה התפרסם בזמן האחרון על ריקי כהן הדמיונית, וזוהי התוצאה: "אני רוצה שנדבר על מר כהן". ניתן לראות כי ביטויים רבים מבלבלים את התוכנה, אולם ברגעיה היפים יוצאים משפטים לתפארת מרב מיכאלי.

נסו בעצמכם

גם בתוכנה זו ניתן להתנסות בהמרת מינו של כל ביטוי העולה על רוחכם – כאן (לאחר הכנסת הטקסט, סמנו את האופציה Jailbreak).

[בלה בלה רשומת אורחת בלה גבי בלה בלה בלה פוסט אורחת בלה צרו בלה קשר בלה בלה דרך הטופס בעמוד בלה בלה]

Read Full Post »

הזמרת והשחקנית מירה עוואד מפרגנת לשלושה חברי כנסת טריים, בדרכה החיננית:

awad0313

שימו לב מה היא אומרת במאמר מוסגר על ח"כ רות קלדרון (ההדגשות שלי):

(הופעתי למען המרכז שלה "עלמא" פעם, שאמנם מלמד דת –ומה לי ולזה– אבל בצורה ליברלית ושוויונית ומבלי להדיר אף אחד על רקע ג'נדר או לאום או דת- ולזה יש לי ועוד איך!)

עוואד לוקחת את הביטוי השגור מה לי ולזה ומייצרת צורה מנוגדת: לזה יש לי ועוד איך. אני תוהה אם מישהו באמת מדבר ככה או שמדובר בהברקה של רגע. קשה למצוא הופעות של הצירופים האלה ברשת, אבל הנה למשל דוגמה אחת של "אני אגיד לך מה לי ולהם", שבאה בתשובה ישירה לשאלה "מה לך ולהם?".

(ובשולי הסטטוס שלה: התעתיקים המאולתרים ר'טאס ואינטיפאדה, והפיסוק שיוצר אווירה משוחררת ולא-רשמית)

Read Full Post »

ניחוחם של גורמי אכיפת חוק במדינות ערב תמיד הזכירו ליובל את עמימותו של התחביר. הפעם, בשולי פרשת האסיר X מדווח טמקא:

מפקד משטרת דובאי: "האסיר X" לא התאבד כי שיתף פעולה עימנו

אם אין צילומסך לי מי לי

אם אין צילומסך לי מי לי

מקריאה ראשונה ונטולת הקשר יכול אדם לחשוב "איזה יופי! כדאי לשתף פעולה עם משטרת דובאי, כך נמנעים מהתאבדות!", ולא היא. לקורא המיודע ידוע כי האסיר אכן התאבד, והשלילה שבכותרת מתיחסת לסיבת ההתאבדות ולא לעצם התרחשותה.

האם אכן מדובר פה בעמימות תחבירית בלבד? לא כל-כך. הפסקה הקודמת אמנם הבחינה בין "[לא התאבד] [כי שיתף פעולה]" לבין "[לא [התאבד כי שיתף פעולה]]", אבל גם תחת המבנה השני לא נעלם לגמרי הקרי שלפיו השלילה היא של ההתאבדות עצמה. הוא רק הופך בלתי סביר מסיבות פרגמטיות (כי אם הוא בכלל לא התאבד, מה זה משנה אם הוא לא התאבד מסיבה זו או מסיבה אחרת*. אם הגזוז בלי מיץ, מה זה משנה אם הוא בלי מיץ פטל או בלי מיץ ענבים. מעניין אם בעת אמיצה זו בה אנו עדים לתחייתו של הגזוז בקיוסקים גם הבדיחה הדלוחה הזו חזרה להיות מובנת. אגב, אני עדיין תקוע עם משהו כמו 2 ליטר תרכיז מיץ פטל בבית מימי טרום-דיאטה אם מישהו מעונין. אני חושב שאיבדתי את חוט המחשבה). אז לסיכום, שוב תודה לכוחות הבטחון המזרח-תיכוניים למיניהם שסיפקו לנו שיעור נוקב בעמימויות. לפי מקורות זרים.

* זה יכול לשנות, אם בהקשר החיצוני שלנו הסברה לפיה הוא התאבד מהסיבה המסוימת הזו עומדת בניגוד לגורל אחר כלשהו ולא בניגוד לסברות אחרות הנוגעות להתאבדות.

Read Full Post »

תראו איזה תרגיל יפה עשה דורון פישלר בביקורת על הסרט 'ענן אטלס' (ההדגשה שלי):

זה לא ש"ענן אטלס" הוא יצירה מושלמת שאסור לדבר בגנותה, או שמי שלא חושב כמוני מטומטם. אני בכלל לא בטוח אפילו שהייתי קורא לו סרט טוב. אפשר לומר הרבה דברים ‏רעים על הסרט הזה, ואני עומד לומר כמה כאלה ממש כאן. יהיו בוודאי הרבה אנשים שייצאו ממנו משועממים, עצבניים או באמצע. אבל יש ‏לסרט תכונה אחת שמפצה על כל מגרעת שיש לו, ובהחלט יש לו: הוא לא דומה לשום סרט אחר ‏שראיתם.

לפועל לצאת יש משלימים משני סוגים. הוא יכול לקחת משלים תוארי או שמני (יצאתי חומוס, יצאתי עצבני, יצאתי אפס, יצא גבר) אבל הוא יכול לקחת גם צירוף יחס (יצאתי באמצע, יצאתי מהבית, יצאתי לטיול). אם מחברים את השניים ללא התראה מוקדמת מתקבל אפקט ספרותי נאה שמכונה זוגמה (זויגמה? זאוגמה?). בעברית, כך גיליתי היום, קוראים לזה "צימוד מסולף".

(למעשה הסיפור טיפה יותר מורכב משום שהמשפט השלם הוא בעצם יהיו בוודאי הרבה אנשים שייצאו מהסרט משועממים, שייצאו מהסרט עצבניים או שייצאו מהסרט באמצע. זה עדיין לא משנה את מידת הזוגמטיות.)

Read Full Post »

אזרחים יקרים,
אתם אולי תוהים למה אני לא מתנקש באלה שמצנזרים אותי.
אז הסיבה היא שאני מקפיד להתעדכן בדרישות השמאל,
וכרגע אני לומד לדבר בלשון נקבה רבות כמו מרב מיכאלי.
גומר את הקורס – ומיד חוזר.
מוות לימינה הקיצונית! (המתנקש השמאלני)

(טור של עוזי וייל, מאת הדמות הסאטירית 'המתנקש השמאלני', לאחר שטורים סאטיריים אחרים צונזרו בפייסבוק)

תשומת הלב נחה לא מזמן על הבחירות המקדימות בעבודה והישגה של מרב מיכאלי שהגיעה למקום החמישי. אבל מה שתפס תשומת לב רבה הוא נטייתה של מיכאלי לדבר בלשון נקבה ובלשון רבות ("הפלסטינאים שולטות במעברים"), כהתרסה נגד מה שנתפש לעיתים כשוביניזם של השפה. הנושא הזה עולה מדי פעם על הפרק אז אשתדל לסכם אותו כאן בקצרה.

הרעש העיקרי נוצר בעקבות הפסקה שחותמת את טורו של יוסי ורטר ב'הארץ' על הפריימריז בעבודה:

מרב מיכאלי וסתיו שפיר הן הילדות השובבות של הרשימה. שפיר היא ג'ינג'ית וזה אומר הכול. למיכאלי יש ברקורד אפיזודות מביכות ביותר: אכילה בידיים, ישיבה על שולחנו של ראש ממשלה, וחשיפת חזייה בטלוויזיה. מדבר אחד היא בטוח תצטרך להיגמל במהרה: מהנוהג המטופש והילדותי, לדבר בשפת נקבה. אם היא תבחר לנאום כך במליאה ובוועדותיה, היא תהפוך מהר מאוד לבדיחה של הכנסת ה-19.

נסכם קודם את הטענות נגד. מיכאלי משתמשת בלשון נקבה בשלושה מקרים: עבור כינוי הגוף הסתמי 'אתה', שהופך אצלה ל-'את'; עבור צורת הריבוי הסתמית ('כאן בונות'); ועבור קבוצה מעורבת של גברים ונשים. הכלל הרשמי של העברית התקנית מוכר: ברגע שיש בקבוצה גבר אחד צורת הריבוי תהיה בזכר ולא בנקבה. ברם, אצל מיכאלי כל עוד יש אישה אחת צורת הריבוי היא בנקבה ולא בזכר. למיטב ידיעתי אלה המאפיינים העיקריים של צורת הדיבור המתריסה שלה.

כללי העברית (כפי שמבהירה האקדמיה) ברורים בנושא: בשלושת המקרים יש לנקוט לשון זכר. המתנגדים לצורת הדיבור של מיכאלי מבקשים לכאורה לקיים את חוקי השפה התקניים. ידידתנו תע"ג מאמצת את העמדה הזו וטוענת שדווקא הגברים מקופחים בעברית משום שלנשים יש צורה מיוחדת משל עצמן ואילו הגברים—המין הלא מסומן—מקבלים את צורת ברירת המחדל הסתמית. לכן, ניתן לומר שאין שום סיבה להיעלב בשם הנשים.

אז אמנם ניתן לנסח טיעון בלשני כמו של תע"ג, אבל לרוב ההתנגדות לצורת הדיבור של מיכאלי חורגת מסתם דאגה קדושה לטוהר השפה שכּן אף כלל אחר לא זוכה להגנה נלהבת כזו. מי שאינם מרוצים מצורת הדיבור הזו — ממש אינם מרוצים. אפילו המגנים בחירוף נפש על שלושה שקלים אל מול שלוש שקל לא חווים התקפי זעם דומים. הם פשוט מתנגדים בחירוף נפש, בלי סיבה מיוחדת. כך למשל עינת קדם (שבלוג הקטנונולוגיה החדש שלה זכה להפניית זרקור אצלנו) הקדישה רשומה לביקורת על מיכאלי, בלי להבהיר מה בעצם בעייתי באופן הדיבור הזה. רק לאחר 51 תגובות מבהירה קדם: "בעיניי הוא בעייתי :)".

אבל מיכאלי, כמובן, אינה טועה בטעות. היא טועה במתכוון והפרובוקציה עובדת. כך כתב בזמנו אהוד אשרי (שכבר ציטטנו בעבר באותו הנושא):

מרב מיכאלי מסרבת לציית לתכתיב הזכרי של העברית. בתוכנית הבוקר שלה ב"רדיו ללא הפסקה" היא מתעקשת לדבר בלשון נקבה בניגוד משווע לכללי השפה, מה שמוליד משפטים מוזרים: "הפלשתינאים שולטות במעברים"; "ב'הארץ' שמות את זה בכותרת ראשית"; "קול ישראל הם בחורות רציניות". מיכאלי פונה ל"מאזינינו הלא עצמאיות" ואומרת לנסים משעל "אני ואתה מסכימות".

בפעם הראשונה זה נשמע כמו טעות צורמת. בפעם השנייה מבינים (כלומר מבינות) שמדובר בשיטה, ואז זה נשמע סתם מגוחך; בפעם השלישית זה מתחיל להישמע כמו נדנוד פמיניסטי. בפעם העשירית את מתחילה להפנים את האמירה הסאטירית המתריסה. נכון, זה מגוחך לפנות לגברים בלשון נקבה, אבל לא פחות מגוחך לפנות לנשים בלשון זכר. מיכאלי מצאה דרך סמלית להביע את מחאת המגדר שלה. מוכרחות להודות שזה יותר חינני מלשרוף חזיות.

וזו הסיבה העיקרית בעד: האמירה המתריסה. או כפי שהבחינה רוויטל מדר:

אך מהי השפה עבור ורטר, שרואה נשים ועדיין בוחר לקרוא להן ילדות. שפה זו אינה יותר מאשר כלי עבורו, שבו הוא יכול להשתמש כפי שעולה על רוחו, אך אוי לה למי שתחליט לבצע בשפה זו שינויים מבלי להיוועץ בו לפני שהיא קמה ועושה את כל אותן פעולות שובבות ומגוחכות שאינן מתאימות לילדה בגילה.

במילים אחרות, למי מותר לשחק בשפה? אליבא דוורטר, רק לו עצמו. אליבא דמדר ומיכאלי, גם להן (ובעצם לכולם/ן).

בהתאם, המחקר שקיים לגבי המין של כינויי הגוף נוגע למאפייני השימוש בצורות זכר ונקבה שלא במיקומן הרגיל: מי, מתי, ובעיקר מדוע. האנתרופולוגית עמליה סער חקרה את השימוש בלשון זכר ובלשון נקבה בקרב נשים יהודיות וערביות בארץ. הממצאים שלה מעניינים (למשל, בעברית נפוץ יותר השימוש בצורת ה"שגויה" בגוף ראשון, ובערבית בגוף שני) וכוללים לא מעט מקרים בהם נשים משתמשות בצורת זכר אפילו כשאין שום סיבה. על שימוש בלשון זכר היא כותבת (סער 2007:425, התרגום שלי):

יתכן ונשים המדברות בלשון זכר זוכות בכך לאפשרות נוחה יותר לבסס את עצמן בלי ליצור את הרושם שהן מסוכנות. בסביבה בשליטה גברית, אשר עשויה להיות עוינת לנסיונותיהן של נשים ליצור נוכחות והשתתפות, אנו יכולים לפרש דיבור בלשון זכר כמנגנון ממתן יעיל.

אם בלשון זכר עסקינן, אפשר להפנות לרשומה על לשון הזכר של הבנות ב'מחוברות'. אבל נחזור ללשון נקבה; מה אומרים הבלשנים? שלא במפתיע, לא ממש אכפת להם (וזו גם עמדתה של האקדמיה ללשון). הרי ברור שמדובר בשימוש מכוון בצורת כלשהי על פני צורה אחרת, ומשום שהמשמעות שלו היא חברתית, אין כאן מה לומר לגבי נכון/לא נכון. זה קצת כמו לבקר שימוש "לא נכון" בעברית בשירה. משום שההתנגדות ללשון הנקבה של מיכאלי חורגת מהתנגדות לכל טעות אחרת, ומשום שהטעות אינה טעות כלל וכלל, כל התנגדות שכזו חייבת להיתפש כקריאת תיגר על הטענה של מיכאלי (אלא אם מדובר במיזוגניה בסגנון ורטר). אבל מה לעשות, עימות עם העמדה של מיכאלי חייב לקבל במובלע שיש על מה להתווכח.

לקריאה נוספת
Levon, Erez  (2012). Gender, prescriptivism, and language change: Morphological variation in Hebrew animate reference. Language Variation and Change 24:33-58.
Livnat, Zohar (2006). Gender online in Hebrew: New technology, old language. In E. M. Thüne, S. Leonardi & C. Bazzanella (eds.), Gender, language and new literacy. London: Continuum. 169–181.
Sa’ar, Amalia (2007). Masculine talk: On the subconscious use of masculine linguistic forms among Hebrew- and Arabic-speaking women in Israel. Signs 32(2):406–429.
Tobin, Yishai (2001). “Gender Switch in Modern Hebrew.” In Hellinger, Marlis, and Hadumod Bußmann (eds.), Gender across Languages: The Linguistic Representation of Women and Men. Philadelphia: John Benjamins. 177–98.

Read Full Post »

חברת הכנסת מירי רגב השתתפה אתמול בפאנל פוליטיקאים בבית הספר 'עמי אסף' ונשאה נאום בן חמש דקות שכבר הספיק לעלות לכותרות (וידאו בכתבה של מקו: מירי רגב: סתיו שפיר קומוניסטית, שלי יחימוביץ' הצביעה חד"ש). רוב התגובות שראיתי ברשת הופתעו מהתוכן המתלהם והמופרך, וכמה מהן קשרו זאת באיזושהי עילגות. זו לא מילה שאנחנו אוהבים לנפנף בה כאן סתם ככה, ולכן אבדוק מה היו הדברים היוצאים מן הכלל בנאום הקצר של ח"כ רגב.

1:18 "יש שמה את מספר חמש, יעקב פרי מסלקוּם". סלקוּם, כמו מיציבוּשי, בשיבוש נפוץ יחסית.

2:08 "גדעון סער הוא לא גנב. גלעד ארדן הוא לא גנב. בוגי הוא לא גנב. מירי רגב היא לא גנבה, בוגי לא גנב!" הצורה התקינה של שם העצם היא כמובן גנבת, וזו אכן שגיאה. אבל זו ודאי לא הפעם הראשונה שנתקלתי בטעות כזו (אפשר למשל לחפש "את גנבה" בגוגל). כשמדובר בחיות, למשל, הסיומת עשויה לבלבל: יעלה או יעלת? ארנבה או ארנבת? השאלה היא לא אם מדובר בחיות שונות וגם לא איזו צורה נכונה; הנקודה תהיה פשוט שהסיומות האלה עשויות לבלבל, ורגב נפלה באחת מהן. (ושימו לב להערה של א' בתגובות ולדברי האקדמיה בנושא)
אבל זה הסבר קל מדי, ויותר סביר שרגב השתמשה בכוונה באותו רצף צלילים, ganav, כדי ליצור המשכיות בין ארבעת הח"כים. האם זה היה בכוונה, אלתור של רגע או חוכמה שבדיעבד — זו שאלה שתחזור לאורך הרשומה הזו, ולא תהיה לי תשובה עליה.

2:20 "מדינת ישראל מדינה יהודית שבירתה ירושלים לנצח נצחים כפיים." זו אולי השורה המפעימה בכל הנאום: רגב בקושי עוצרת בין נצחים ובין כפיים, והקהל מגיב ומוחא כף בהתלהבות. האם זה חידוש של רגב? האם אנשים באמת מדברים ככה? הדרך היחידה להבחין בכך שהמילה כפיים אינה חלק מהמשפט היא שרגב מטעימה עם האצבע המורה כל מילה ומילה מלאת פאתוס במשפט הזה, ואז בכפיים האצבע מונפת אל-על.
הממיסט עמיר שיבי כבר הגיב עם מם מסדרת 'פה חשדתי': ואז היא אמרה "ירושלים יהודית לנצח נצחים כפיים". כאן חשדתי. והמגיבה דנה שרון הספיקה להעיר: ואז הוא אמר "כאן חשדתי". פה חשדתי.

3:03 "כי אם אנחנו לא נגן על עצמנו לא יהיה מי שיגן על עצמנו". מצד אחד, אפשר לומר שרגב כושלת כאן בשימוש בכינוי החוזר והצורה הנכונה היא לא יהיה מי שיגן עלינו. ואני נזכר כאן בסיפור על מ"כית הטירונות של ידידתי תמר, שאמרה לכיתה שלה ברגע של כעס "תרגיעו את עצכם לפני שאני ארגיע את עצמכם". אבל מצד שני, אפשר לומר שיש כאן הדגשה מכוונת של רגב. יש ספרות מקצועית שלמה על המצבים שבהם הפרות כאלה של חוקי הכינויים החוזרים אפשריות, והשימוש הזה בהחלט מתקבל על הדעת כהדגשה והשוואה.

3:10 "[אבו מאזן] שמדבר בעברית בשפה אחת, באנגלית בשפה אחרת ובערבית בשפה אחרת". כמובן שאבו מאזן מדבר בשפות שונות בשלוש השפות — אלה שפות שונות! אבל גם במקרה הזה, בין אם במתכוון ובין אם לא, הכוונה ברורה. אולי יש כאן כפילות, אבל לא עילגות. אפשר גם להבין את טענתה של רגב כך: הדברים שאבו-מאזן אומר לקהלים שונים נפרדים כל כך זה מזה שמובן מאליו שהוא משתמש בשפות שונות בשביל להביע אותם.

4:00 "מותר לי לדבר בשקט". רגב מבקשת משאר הפאנליסטים לא להפריע לה. מה שמעניין אותי כאן הוא השימוש בתואר הפועל בשקט במשמעות של 'בלי שיפריעו לי' ולא במשמעותו המילולית. זה כנראה נובע מכך שמייד קודם לכן רגב אמרה שהיא עצמה ישבה בשקט כשחברי הכנסת האנטי-ציונים דיברו.

4:43 "אנחנו רוצים לעשות את שיקום שכונות". שיקום שכונות הופך כאן לשם של פרוייקט, ובהתאם זוכה למילת היחס את.

5:20 "מי שהחזיר את גלעד שליט הביתה היתה נתניהו". נראה לי שכאן רגב מתבלבלת אחרי שהיא דיברה על מפלגת הליכוד ועל המדינה, וממשיכה עם ההתאמה בנקבה. אולי יש כאן גם בלבול בעיבוד הפונולוגי בגלל ה-ת' בשמו של נתניהו.

6:40 "זאת המדינה שלנו. תפקידנו לשמור עליה עם חברי כנסת ציוניים שבעד מדינה יהודית דמוקרטית". רגב מבטאת את המילה שבעד "שֶבָּד" (shebaad). לא נראה לי שזו ההגייה הטבעית שלה, ואני לא יודע עד כמה ההגייה הזו נפוצה. אולי היא מדלגת על הברה בלהט הרגע. מעניין.

זה סיכום חומר הראיות, ולדעתי יהיה קל מדי להתייחס לזה כעילגות. אמנם מדובר בנאום דמגוגי לעילא אבל הרקורד של ח"כ רגב לא נותן סיבה לחשוב שהיא אשפית בשימוש בשפה, אז לא הייתי אומר שהיא מנסה להתחנף לתיכוניסטים בשפתם. זו פשוט שפה רגילה, עכשווית, יומיומית, ולמי שחושב שרגב עילגת כדאי להתרגל לזה.

אני מתחמק כאן לחלוטין מהשאלה "מיהו עילג". עבורי מדובר באיזושהי מסה קריטית שאני מעדיף לא להגדיר בשלב זה. אמרתי לא מזמן שפוסט פייסבוק של אלי ישי הוא עילג, ושם באמת היו שגיאות רבות בפסקה אחת. אבל רגב מדברת עברית עממית בסדר גמור בנאום הזה, במיוחד עבור מדינה שהחינוך נמצא במרכז סדר העדיפויות שלה כפיים.

Read Full Post »

עם פרוס השנה החדשה ועם פרישתה של מזל שיניאק מתפקידה כמפמ"ר עברית יצא לאור קובץ מאמרים לכבודה.
אחרי הקפיצה: קובץ PDF עם תוכן העניינים. אני תמיד שמח לראות יחסי גומלין בין חקר השפה וחקר ההוראה, ולפחות הפרקים של הבלשנים נראים מבטיחים.

המשך…

Read Full Post »

הנה אחד המערכונים המפורסמים ביותר של אסי כהן וגורי אלפי, "חייזרים", הידוע יותר בשם "פה חשדתי". לאחרונה צפיתי בו שוב ושמתי לב שכמות בדיחות הבלשניות בו גבוהה במיוחד. אז ברשומה הזו אני עומד להרוס אותו. כלומר, אני הולך להסביר כל בדיחה ובדיחה, ואצביע על התרגיל הבלשני שאסי וגורי עשו כדי להשיג אפקט קומי. אתם מוזמנים לעקוב עם המערכון, ואם לא ראיתם אותו עדיין אולי כדאי לצפות בו פעם אחת לפני קריאת הרשומה הזו.

0:00 קודם כל, שימו לב שהדמות של אסי כהן – "יעקב" – מדברת בחי"ת ועי"ן. כי כידוע, מבטא מזרחי הוא מצחיק ועממי.

0:20 "יום אחד היה מזג אוויר". המילה היה לוקחת משלים תוארי: מזג האוויר היה חם, המשחק היה כיף, אבל לא *המשחק היה ילד. בעברית המודנית נהיינו יצירתיים: היה טוב, היה יוסי. היה אש. כשיעקב אומר מזג אויר הוא מתכוון למזג אויר נעים, שהרי אם אין מזג אויר (נעים) לא הולכים לטייל, וזה בדיוק מה שהדמות עשתה. בדיחה על התפר תחביר-סמנטיקה-פרגמטיקה.

0:25 "מטייל, מטייל". במובן של 'הולך', 'מסתובב'. למילה לטייל ככה, כשחוזרים עליה, יש כבר משמעות של להגיע למקומות רחוקים: 'טיילתי וטיילתי ובסוף הבנתי שאין כמו בארץ'. הטיול של יעקב הסתכם בשכונה שלו.

0:31 "כיפכוף של טיול". לדמות אין דרך להגיד כמה כיף היה לה, אז היא יוצרת את הצורה כיפכוף. למה כיפכוף? ראשית, כי יש מילה כזו בסלנג עם משמעות אחרת ('לתת כאפה') והדמות הזו משתמשת במילים רבות בצורה לא מתאימה, כפי שנראה גם בהמשך. אבל המשמעות ברורה, גם מההקשר וגם כי יש כאן מה שמכונה הכפלה (reduplication). הכפלה היא דרך ליצירת מילה שבשפות רבות משמשת למשמעות של חיזוק או התמדה, כאילו שבעברית היינו אומרים טיילטיילתי במשמעות של 'טיילתי הרבה', או בישלבישלת במשמעות של 'בישלת כל היום'. בעברית התופעה הזו פרודוקטיבית פחות ודווקא מקושרת עם הקטנה (כלב > כלבלב, פיל > פילפילון, חתול > חתלתול), אבל יש משהו בהכפלה שמתקשר באופן די טבעי לחיזוק והדגשה ולכן יעקב יכול לדבר על כיפכוף בתור משהו ממש כיפי.

0:34 "פתאום הבחנתי לב בזקנה". הכלאה בין הבחנתי ובין שמתי לב, מה שמכונה באנגלית mixed idioms. למשל בעברית, שיבושים דוגמת העם נקעה רגלו (א' בנאי) או באין ציפור שיר – גם מטאטא יורה (כפי שאמרו מ' ניב וע' גלילי).

0:37 "זקנה, מהשורש מבוגר". שני דברים. ראשית, הדמות אומרת סְקֵנָה ואפילו מדגישה את הסמ"ך. טוב, ככה אנחנו באמת מדברים — עיצור קולי (כמו ז') מאבד את הקוליות שלו לפני עיצור לא-קולי (כמו ק') והופך לעיצור לא-קולי בעצמו (כמו ס'). זה מה שקורה כשאנחנו אומרים ספתא במקום סבתא. בדיחה סוציו-פונולוגית.
שנית, "מהשורש מבוגר". שורש, במשמעות הלשונית, הוא רצף העיצורים שבבסיס כמעט כל מילה בשפות השמיות (כ.ל.ב, ז.ק.נ, וכו'). השורש של המילה מבוגר הוא ב.ג.ר — כשלעצמה המילה אינה שורש. אבל הדמות מנסה להיראות חכמה, ומשתמשת במונח הלא נכון.

0:44 "אתה רואה זקנה, אתה חושד בה?". גם המבנה הזה אופייני לעברית מדוברת מודרנית – אין "אם" או אפילו "נגיד" בתחילת משפט התנאי. חוץ מזה שזו שאלה נורא מוזרה, ולכן מצחיקה.

0:46 "כביכול זקנה". אין שום משמעות למילה כביכול כאן. הדמות כנראה ניסתה להגיד משהו בסגנון "פשוט זקנה" או "סתם זקנה", אבל כביכול נמצא במשלב גבוה יותר.

0:47 "מזדקנת לה". עוד בדיחה מורפולוגית מצוינת. הרי המילה להזדקן קיימת בעברית, אבל לרוב אנחנו לא משתמשים בה כדי לתאר אירוע (?הזקנה עומדת עכשיו ומזדקנת) אלא תהליך ארוך יותר (ילד מזדקן, הורה מזדקן, איך הזדקנתי). כדי לוודא שהמשמעות עוברת, הדמות של אסי כהן מוסיפה את צירוף היחס לה, שמתאים יותר למבע הקודם: עומדת לה. שפת הגוף של הדמות מדגישה את זה שהזקנה פשוט עומדת שם. צירוף היחס הזה הוא נושא מרתק כשלעצמו: זה אינו צירוף יחס רגיל, כמו במשפטים דוגמת "אסי אמר לה שהיא זקנה". זה גם לא צירוף שייכות כמו במשפט "נפלה לי המטריה", שבו מטרת המילה לי היא להביע שהמטריה שייכת לי. הוא הולך לרוב דווקא עם פעלים עומדים, כלומר כאלה שאין להם מושא ישיר, ומביע איזושהי השפעה חוץ-לשונית על הדובר: מה אתה רץ לי בכל הבית; עוף לי מהעיניים. בשפות רומנסיות המבנה הזה נפוץ למדי, ומכונה לעיתים בשם המקסים ethical dative. השוו: "לך לך מארצך וממולדתך ומבית אביך אל הארץ אשאר אראך".

0:51 "זקנה נטו". כביכול זקנה נטו.

0:54 "הנה המתח מגיע". אבל מתח לא יכול להגיע לאנשהו!

0:57 "מאחוריה עמד בחור עם חזות מזרחית". הצירוף הנכון הוא 'בעל חזות מזרחית', והדמות מערבבת את הקניין המטאפורי ('בעל חזות') עם הקניין הפיזי (מחזיק חזות בידיו פיזית).

1:03 "מה אני, אה, חשדניסט?" בנסיון מאולתר למצוא מילה מתאימה, יעקב משתמש בסיומת –יסט שיוצרת תארים אופייניים ובעלי מקצוע. השוו: סטטיסט, סטנדאפיסט, אפשר למצוא אפילו מטרידניסט.

1:06 "עכשיו זה המתח! הנה המתח". המטאפורה הזו, של מתח שמתקרב ובא, עובדת מצוין…

1:08 "מתח!" …ואין דבר פחות מותח מאשר להגיד את המילה מתח בשביל להביע מתח. זה כמו שבמקום לכתוב את הרשומה הזו אני פשוט אגיד "ניתוח בלשני!"

1:09 "הבחור עם החזות רץ וחטף לה את התיק". שוב עם החזות.

1:13 "פה חשדתי". למה זה כל כך מצחיק? ראשית, כי אסי כהן נותן הופעה נהדרת והשורה הזו נאמרת במעין תמימות. ושנית, כי במשך הדקה שעברה בינתיים הדמות שלו השתמשה בשורש ח.ש.ד על הטיותיו השונות עשר פעמים כדי להגיד שהיא לא חשדה בדבר. הציפייה שלנו הלכה ונבנתה ("עכשיו זה המתח!") והיה ברור לנו שתיכף יקרה משהו מחשיד, אלא שאז הסיפור קפץ מייד לשוד עצמו: הבחור ראה שוד מתרחש מול עיניו, וכל מה שהוא יכול להגיד זה שזה היה מחשיד? זו הפרה פרגמטית בוטה של כללי השיח. והפרה פרגמטית בוטה של כללי השיח זה מצחיק!
יש עניין נוסף, בשולי הדברים, והוא השימוש בתיאור המקום פה שלא מציין מקום בכלל. למעשה, פה מתייחס כאן לסיטואציה ולנקודת זמן, ולא למשמעות 'כאן, במקום שאני עומד בו'. זה לא עניין חדש; למשל, המילה לאלתר שמשמעותה תיאור זמן היא הלחם של על+אתר, 'בַמקום'. וגם בעברית מודרנית: על המקום הוא תיאור זמן ולא תיאור מקום.

1:16 "הרמתי מקל והתחלתי לטינית". אין לי מושג למה הוא מתכוון. למה לטינית זה להרביץ?

1:19 "תחזיר לה ת'תיק, פושע! תחזיר לה ת'תיק, קרימינולוג!" שוב שימוש במילה במשלב גבוה יותר, שוב שימוש שגוי.

1:25 "ואני מדריך עליו, ומדריך, ומדריך". זה כנראה החלק האהוב עלי במערכון. זה מצחיק כי המילה מדריך, משמעותה שונה לגמרי. על פניו, המילה הנכונה היא דורך. אבל הדמות רצתה להגיד משהו יותר חזק מסתם לדרוך (וזו באמת נראית כמו דריכה אלימה למדי). לבנין הפעיל יש משמעות של גרימה, אבל לרוב הוא לא בשימוש כשיש צורת גרימה קיימת בבנין קל (דורס > *מדריס, אבל קופא > מקפיא). למרות שלא נוצרת צורת גרימה בבניין הפעיל כשיש צורת גרימה בבניין קל, יעקב משתמש בבניין הזה בשביל להדגיש את האינטנסיביות של הדריכה. אולי המילה הזו גם נוצרת אצלו באנלוגיה לצורות כמו מוריק עליו.

1:33 "אמרתי לה: סליחה שאני מנומס". מנומס, כלומר באופן סרקסטי, 'סליחה באמת שאני מנסה לעזור לך'? או שזה אמור להיות 'סליחה שאני מדריך עלייך, זה מאוד לא מנומס', רק בלי המילה לא?

1:49 "אני לא מבין בחמזמזים". הוא כל כך לא מבין בחייזרים שהוא אפילו לא יודע איך אומרים את המילה.

2:00 "תגיד משהו על הזה". הדמות של גורי אלפי מתחילה להיות מתוסכלת מכך שהיא העלתה לתוכנית שלה מישהו שבכלל לא נחטף ע"י חמזמזים חייזרים. אז היא מבקשת, באופן כללי, מהאורח להגיד משהו על ה"זה". מה זה "זה"? לא משנה, העיקר שיהיה קשור לחטיפה ע"י חייזרים. זו גם מילה קצרה יותר מחייזרים אז הקהל בבית לא ישמע אותו מבקש.

2:24 "הזקנה התפצלה לשתיים". התפצלה בפ"ה רפה (f), לא התפּצלה. אי דיוק בבג"ד כפ"ת הוא סממן נוסף של עברית "עממית".

2:33 "על האור היתה מדובקת חללית, עם סקוץ'". זה כמובן תיאור לא הגיוני בעליל, אבל המילה מדובקת מעניינת אותי. היא כביכול בבנין פֻעל, שלא נפוץ במיוחד בעברית המודרנית. אבל חוץ מזה, לפעלים סבילים בעברית קיימות תמיד גרסאות פעילות, כך שלצד הפועל דֻבַק אמור להיות קיים הפועל דִבֵּק, מה שלא נכון. הנוסחה עובדת כמו שעון: שורש בבניין הלא נכון = צחוקים.

2:39 "החללית הסתובבה בצורה אליפסיסטית". עוד נסיון כושל להשתמש במילה מז'רגון או משְלב זרים.

2:45 "עם שלוש קרן לייזרים". אם למישהו היה ספק שיעקב הוא בחור עממי וחביב, אז במקום להגיד 'שלוש קרני לייזר' הוא יוצר ריבוי מהצורה 'קרןלייזר', כאילו היתה מילה אחת, ומקבל 'קרןלייזרים'. עכשיו, המילה הזו אמורה להיות צורת ריבוי של מין זכר (קרןלייזרים ולא קרןלייזרות) אבל היא מקבלת אצלו את המספר המונה שלוש, שמיועד בצורה תקנית לנקבה (שלוש בנות), במקום את שלושה שמיועד לזכר (שלושה ילדים). כידוע, ההבחנה הזו הולכת ונעלמת מהשפה המודרנית ונכתב עליה רבות, אצלנו ואצל אחרים (למשל, שלוש שקל).

2:50 "חמשת אלפים מטר גובה". נשמע לי כאילו העיצור האחרון במילה גובה נהגה בצורה גרונית, 'גובע'. זו כנראה השפעה של השימוש המוגזם בעי"ן לועית.

2:59 "אמרתי לו: אל תאכל אותי, יש לי אישה וילדים! תאכל אותם". סוף סוף פאנץ' שהצלחתי לחזות מראש. זו בדיחה קלאסית שמשחקת על כך שהאימפליקטורה (מה שנרמז) מהמשפט הראשון היא שהאישה והילדים חשובים מאוד לדובר, ואז בא המשפט השני וסותר אותה. וכידוע, סתירות פרגמטיות זה מצחיק.
בנוסף, הכ"ף הרפה מבוטאת כאן כמו הח' הלועית ולא כמו כ' וילונית "רגילה", שוב בהשפעת ההגייה המזרחית לאורך הקטע.

3:07 "תגיד לי שיהיה על הזקנה". תיאור הזמן נפתח, כמקובל בשפה המדוברת, באמצעות המילית ש- ולא באמצעות כש-. מעבר לכך, שיהיה על הזקנה זה תיאור שהוא מצד אחד כללי מאוד (שיהיה מה?) ומצד שני ברור מאוד בהקשר ('כשיהיה תורי לדבר על הזקנה', 'כשיהיה אייטם על הזקנה').

3:16 "ושמה, בפנים החללית אתה מרגיש כאילו אתה בתוך חללית, זה מדהים". קודם כל, שיבוש קל לשם השיבוש: בפנים החללית במקום בתוך החללית. ויש שיאמרו, בבפנוכו של החללית. שנית, הקלישאה 'כאילו אתה בתוך חללית' נשלפת כדי שיעקב יוכל לספר על החוויה שלו; אבל לפי הסיפור שלו הוא באמת היה בתוך חללית אז הדימוי הזה הוא מצד אחד מיותר ומצד שני מאוד קולע, והשילוב של השניים יוצר הומור.

3:20 "ומלא עב"מים עם לייזרים ושקפקפים". יעקב מתאר איבר או אביזר שיוצא בערך מאזור האוזניים כשהוא אומר שקפקפים. אבל שקפקפים הם כמובן סנדלי פלסטיק שקופים (הנה שירות לציבור עבור קוראינו הצעירים), ולפחות כשאני הייתי בבי"ס היינו מבטאים את המילה הזו עם טעם על ההברה הראשונה (שקאפ-קפים) ולא עם טעם מלרעי סטנדרטי כמו של יעקב (שקפ-קפים).

3:29 "עם לשון בגב מתנפנף למטה". כאן יעקב כבר בשוונג ואי אפשר לעצור אותו. מה מתנפנף? הלשון? לשון מתנפנפת, לא מתנפנף. שגיאה בהבדלה בין זכר ונקבה = עממי ומצחיק!

3:31 "וקמח! מלא קמחים של קמח, קמח". עוד אחד מהרגעים האהובים עלי במערכון הזה. איך קוראים להרבה סוגים של קמח? קמחים! קמחים של קמח! יש כאן שימוש במאייך מאולתר, שהוא דרך למנות שם עצם שלא ניתן למנייה (שלוש כוסות מים ולא * שלושה מים; עשרה קבין של יופי ולא *עשרה יופי; שלושה קמחים של קמח ולא *שלושה קמח). שימוש במאייך מאולתר שכזה יכול להיות דבר משעשע מאוד: בכמה פרקים של 'משפחה בהפרעה' הדמות הראשית אוכלת, ברגע של דכאון, "a whole thing of jelly beans", כלומר "כזה שלם של סוכריות". זו לא בדיוק שקית ולא בדיוק קופסת פלסטיק – זה "כזה". ובהתאם, מלא קמחים של קמח. כך אנחנו יכולים להשלים עם הדמיון האם מדובר בסוגים שונים של קמח, או במיכלים שונים, או פשוט בהמון המון קמח. מה שצורן ריבוי אחד יכול לעשות.

3:35 "ולולב מתלבלב על הראש". הרי מה עושה לולב? נסחוט ממנו את השורש ל.ל.ב/ל.ב.ל.ב ונמצא את הבניין הקלאסי לפעלים חוזרים, הלא הוא בניין התפעל. בהתאם, הלולב מתלבלב.

3:39 "וכל האצבעות שלהם זרת". למה הכוונה, כל האצבעות שלהם זרת? מן הסתם שכל אצבע היא זרת. אבל מה זה בעצם אומר? זרת היא, בהגדרה, האצבע הצרה שנמצאת באותו צד כמו עצם הגומד (כלומר הצד הפנימי של היד כשכף היד מופנית כלפי מעלה), אז אמורה להיות רק אחת כזו. יעקב כנראה התכוון שכל האצבעות של החייזרים הן באותו הגודל וכולן קטנות וצרות יחסית (והוא מייד מדגים: "זרת, זרת, זרת, זרת…"). אז מה הוא יגיד, שכל האצבעות שלהם זרתות? אין מילה כזו. הוא היה יכול להגיד שכל האצבעות שלהם הן זרת, אבל זה היה מאריך את המשפט ומפריע לפאנץ'.

3:43 "מלא זרִתות". מה, האמנתם לי כשאמרתי שאין מילה כזו, זרתות? זה סימן שקומיקאי יכול להשתמש בה! שימו לב שיעקב אומר זרִתות ולא זרָתות; לא ברור לי למה, אבל צורות לא תקניות זה מצחיק.

3:56 "-אני מבין שהם עשו עליך ניסויים. זה החלק הקשה. -כן, הם אמרו לי: תתחתן עם זאת ועם זאת ועם זאת". בדיחה שחוקה, אבל אחרי 4 דקות של פעלולים לשוניים הבדיחות הקלאסיות שוברות את התבנית. הבדיחה גם משתלבת היטב בסיפור שנבנה במערכון.

4:14 "אתה מלחיץ את זה". הדמות של גורי מלחיצה את יעקב, אבל בעברית אפשר להלחיץ רק בני אדם וחיות, לא חפצים ועצמים מופשטים: אל תלחיץ אותי, ולא *אל תלחיץ את הספר או *אתה מלחיץ את הציפייה. למה התכוון יעקב? הוא כנראה רצה לומר שהמראיין שלו מאלץ את זה ובו זמנית מלחיץ אותו.

4:21 "נסענו לכיוון הירח, בדרך עברנו ליד שביל החלב, לקחתי שוקו". אם כבר בדיחות שחוקות על החלל אז עד הסוף.

4:26 "נסענו נסענו, הגענו לירח, אבל לא הכניסו אותנו. למה היה ירח מלא". שימו לב למשמעות המתמשכת של נסענו נסענו — מדובר בסוג של הכפלה! פסוקית הסיבה כאן נפתחת במילה למה ולא במילה כי, כמקובל בשפה המדוברת. וכמובן, הירח המלא, כי צריך לנצל את כל בדיחות החלל כל עוד אפשר.

4:39 "-איך אתה מסכם את ההיכרות שלך עם אותם חייזרים? איך היתה ההיכרות? -שלום שלום, מה נשמע, בסדר? אני בסדר, איך אתה?". המילה היכרות היא שם הפעולה של הפועל להכיר, ולשמות פעולה יש לפעמים שתי משמעויות קשורות אבל נפרדות: אחת היא ממש הפעולה עצמה, והשנייה היא שם עצם שנגזר ממנה. למשל, יש הכנסה כשמכניסים משהו לאנשהו ויש הכנסה שהיא משכורת. הדמות של גורי שואלת על ההיכרות במובן של שם העצם המופשט, החוויה של המפגש עם החייזרים בכללותו. יעקב מתייחס למשמעות הישירה יותר, שם הפועל, ומסביר את האירוע עצמו. השניים ממשיכים מיד עם אותו הרעיון: "ההיכרות הראשונית — משחקי היכרות".

4:50 "-עזוב, אני מצטער ששאלתי אותך. -אני מצטער שתשתוק". הרי אי אפשר להצטער ש-[ציווי] בעברית. משפט קלאסי לסיום המערכון.

אז מה היה לנו? כמה סוגים שונים של משחקים לשוניים. הדמות של יעקב מקוטלגת בסטריאוטיפ מסוים לפי ההגייה שלו והשימוש הכושל במילים ממשלב גבוה. הפרות פרגמטיות בוטות משמשות לאפקט הומוריסטי, כפי שבדיחות עובדות מקדמת דנא. אבל בעיקר, יש כאן הרבה בדיחות תלויות מורפולוגיה ובניינים שאפשר לעשות רק בשפה כמו עברית. זה מערכון שיהיה קשה מאוד, אם לא בלתי אפשרי, לתרגם בצורה נאמנה לשפה אחרת.

ועכשיו, לשיעורי הבית שלכם: נתחו את הבדיחות במערכון הבא (במיוחד בחצי הראשון שלו).

Read Full Post »

חבר הקונגרס טוד אייקין ממיזורי הוא שם שלא יורד מהכותרות בימים האחרונים. המועמד השמרן לסנאט, מתנגד נחרץ להפלות, התראיין ביום ראשון במסגרת המירוץ לסנאט והביע בין היתר את הדעה הבאה לגבי אונס:

If it's a legitimate rape, the female body has ways to try to shut that whole thing down.

מה. לעזאזל.

אני מעוניין להבהיר שני דברים ברשומה הזו. הראשון, מה עבר לאיש הזה בראש ולמה הכוונה ב-legitimate rape, משום שהביטוי עשוי להיות מעט סתום למי שלא עוקב אחרי המערכת הפוליטית בארה"ב (או ליתר דיוק, למי שלא עוקב אחרי כמה אמונות תפלות מיזוגניות במיוחד). השני, הכשלון הגורף של כלי התקשורת בארץ לתרגם את הצירוף הזה כמו שצריך ולתת לו את ההקשר הנכון.

אני מקווה שאתם יושבים: בקרב אנשים מסוימים רווחת האמונה כי בעת אונס, גוף האישה מסוגל למנוע התעברות. מכאן, שאם האישה נכנסה להריון, סימן שלא היה זה אונס אמיתי, שהרי הרחם היה מסוגל 'להוריד את השאלטר', אם לתרגם את אייקין. אכן ישנם אנשים בעלי כוח והשפעה שמאמינים בדבר הזה, חלקם חברי קונגרס וחלקם — כך נראה — מועמדים לסגנות הנשיאות. הנקודה היא שאונס במהלך הנישואין, אונס בדייט ושלל "סוגים" נוספים אינם באמת נחשבים ל-legitimate rape, והאובר-חוכמים האלה אפילו מבדילים בינם ובין מה שהם מכנים forcible rape. סקירה מקיפה יותר ניתן למצוא אצל ג'זבל/איזבל, וניתוח לשוני ראשוני באנגלית ניסה לערוך ג'ף פולום. אמת, לא כל תושבי ארצות הברית הבינו למה בדיוק הכוונה, אבל מהר מאוד ההסבר הנכון נפוץ בצורה כזו או אחרת.

אז מה לגבי הכיסוי בקרב אתרי החדשות המובילים שלנו? לצערי, כולם תרגמו את הצירוף כ-'אונס לגיטימי'.

דא עקא שהמילה לגיטימי והמילה legitimate אינן תרגומים ישירים אחת של השנייה. למילה legitimate שני פירושים. את הראשון ניתן אולי לתרגם 'אותנטי' או 'אמיתי', ואת השני בתור 'לגיטימי'. עמיתי פינטר העיר יפה שהראשון עוסק במודליות אפיסטמית, כלומר מה שאני חושב הוא המצב, והשני עוסק במודליות דאונטית, כלומר מה שנכון על פי חוק או על פי נורמה חיצונית מסוימת. למשל, סכין הוא כלי נשק לגיטימי על פי הפירוש הראשון — פשוט כי אפשר להשתמש בו כדי לפצוע ולהרוג. אבל הוא לא כלי נשק לגיטימי על פי הפירוש השני אם מולך עומד אדם לא חמוש — לא מדובר בקרב הוגן.

אני חושב שהפירוש הראשון לא קיים עבור המילה לגיטימי בעברית, ולפחות מהבחינה הזו היא מהווה מה שמכונה false friend ("ידיד כזב"?). תרגום הולם יותר לצירוף הזה יהיה 'אונס אמיתי', או אפילו 'אונס של ממש'.

אז איך קרה שכל האתרים טעו? עמיתי טל התחקה אחר הקרדיטים ושם לב שעל הידיעה ב'הארץ' חתום הניו יורק טיימס, כלומר מי שכתב את הטקסט ב'הארץ' הוא מתרגם. אבל הידיעה כבר הופיעה חמש שעות קודם לכן קודם בטמקא, ושם הקרדיט ניתן לכתב בוושינגטון. האמת היא שזה לא משנה אם כל אחד טעה בנפרד או שכולם העתיקו אחד מהשני, העיקר שאחרי יום-יומיים כולם הבינו שהיתה טעות, נכון?

אוף

אפשר וקוראינו נזכרים בסיפור דומה מדצמבר 2010, אז שלל אתרי חדשות דיווחו על יועציו ה"פסיכו-פנאטים" של רג'פ טאייפ ארדואן. בסוף התברר שהם סתם היו sycophants, או מלחכי פנכה. אז, כמו עכשיו, תשומת הלב הזעומה הובילה לתרגום שגוי ולדיווח לקוי.

[ת' לטליה ולמערכת הבלוג הנמרצת]

Read Full Post »

דורון קרמר, בפוסט שאני לא ממליץ לקרוא, כותב במשפט (שאני גם לא ממליץ לקרוא, אבל די אין לכם ברירה כבר):

והייתי דוחף את הלשון שלי לאוזן של אבי לוזון תוך כדי זה שהוא דוחף את שלו לזו של דידייה דרוגבה.

שפה זה דבר מרשים. שימו לב מה קורה כאן: יש שתי לשונות, וכל אחת מהן נדחפת לאוזן אחרת, ועם זאת אין צורך לציין את שמו של אף איבר במלואו יותר מפעם אחת! הכינוי הרומז "זו" מחזיר אותנו לאוזן של אבי לוזון כדי לדעת שמדובר דווקא באוזן של דרוגבה, ובשביל הלשון של לוזון אפילו לא צריך כינוי רומז: כינוי השייכות "שלו" מספיק כדי ליצור את הניגוד שבין לשונו של האני-השר לזו של לוזון.

ההקפדה על שמירת מבני המשפטים והחזרה על הפועל "דוחף" ומילות היחס "את" ו-"ל" מספיקים לנו להשלים לא מעט מהחסר בעצמנו. שאפו, מוח אנושי.

[כאן הייתי אמור להביע את תמיכתי בנבחרת מסוימת ביורו, אבל לא התחברתי לאף אחת. אז יאללה קיץ בלי הרבה שרב!]

Read Full Post »

כיוון שצלילי הצרצרים בלובי הבלוג כבר מתחילים להעיק על נשמתי, אשתף אתכם בתהיה שטרם הבשילה לממדי מחקר, ולו האינטרנטי הזול שאנחנו כל כך אוהבים כאן.

(הכל פה מנוסח בלשון זכר כי אם אני אתחיל עם לוכסנים הפוסט הזה ייראה כמו כתובת אינטרנט)

אם אחותי או אשת-אחי בהריון מתקדם (וראשון), יכול אדם סביר לגשת אליי ולומר "אתה הולך להיות דוד!". הנה אפילו יותר מאלף תוצאותג* להביטוי המדויק.

אם בתי או כלתי בהריון ראשון, יבואו ויאמרו לי "אתה הולך להיות סבא!". לא ברור למה רק תשע תוצאותג, זה די דומה לעניין הדוד בעיניי.

אם אני בן יחיד ואמי בהריון, לעומת זאת, "אתה הולך להיות אח" נשמע לי רע. גם שבע תוצאותג לא יעזרו (ושימו לב שהאחרונה מדברת על אח מסוג קמין, ואחת לפחות מדברת על אחים חורגים, כלומר "אתה הולך להיות אח של [מישהו ספציפי]", וציפיתי גם לאחד רפואי אבל לא תמיד מקבלים הכל), זה מצלצל לי רע.

התחושה שלי היא שההדדיות היא שמפריעה פה – התינוק הרי ייוולד אח בעצמו, כלומר לא הישג מי יודע מה. כנראה גם תורמת העובדה ש"אח" נתפס בעיני פחות כתכונה מאשר "דוד" או "סבא". "הולך להיות לך אח" מתיישב פה כל כך, כל כך הרבה יותר טוב.

מסכימים? מתנגדים? יאללה תנו בתגובות. אני יודע שכולכם מול המחשב, אתם משותקים מהעל-האש.

*תוצאות גוגל, בהעדר תרגום יותר מטופש ל-ghits.

Read Full Post »

ראיתי שלט גדול תלוי בבניין המדרגה באוניברסיטת חיפה בקיץ שעבר, "הפקולטה למשפטים מברכת ומחבקת את בוגריה", והמחשבה הראשונה שחלפה בראשי היתה: אוי לא, מה קרה?

אפשר להירגע, לא קרה שום דבר (או כמו שהייקים אומרים, שום דבר קרה). בסה"כ עוד מחזור של פרחי משפטים סיים את לימודיו בהצלחה, אבל משהו במשפט הזה גרם לי להיחרד לרגע. והמשהו הזה היה הפועל הבעייתי לחבק: נתקבל אצלי הרושם שמשמעותו המילולית של הפועל נשחקת, והוא מקבל משמעות עיקרית חדשה, בערך 'להשתתף באבלו של מישהו'. דוגמאות אפשר למצוא בקלות כאן וכאן (טוב, אין שם קישורים — זה כל כך נפוץ שלא טרחתי לגגל).

זה לא שהמילה לא קיימת במשמעותה המילולית, המקורית, גם בלשון הדיבור. אפילו בלשון הכתיבה אפשר לשלוח למישהו חיבוק או חיבוקי, עם יו"ד החמידות האינטרנטית. אבל הפועל עצמו זולג לכיוון השכול, לפחות להתרשמותי האישית. אז ערכתי בדיקה קצרצרה.

חיפשתי בקורפוס העברית החינמי "גוגל" את הצירופים לחבק את המשפחה, מחבקים את המשפחה, לחבק את המשפחות, מחבקים את המשפחות, לחבק את מי ומחבקים את מי, ובדקתי ידנית האם מדובר בשימוש המילולי של לחבק או בשימוש המטאפורי יותר, של לנחם ולתמוך נפשית. בגלל שזה מדגם קצת מוטה הוספתי גם חיפושים עם המילה חבר/ה:

צירוף הופעות מילולי מטאפורי
לחבק את המשפחה 63 37% 63%
מחבקים את המשפחה 49 2% 98%
לחבק את המשפחות 61 2% 98%
מחבקים את המשפחות 56 100%
לחבק את מי 67 73% 27%
מחבקים את מי 18 44% 56%
לחבק את החבר 29 97% 3%
לחבק את החבֵרה 20 100%

כמה מהתוצאות מוזרות למדי: "אנו מצדנו מחבקים את מי שיחפוץ לענות לשואלים ויעשה זאת מתוך כוונה לענות על צרכי השואל ולטובתו. אין בכוונתנו להחליף יעוץ של יועצי האיטום, זהו תחום התמחותם".

ומעניין שהמפרסמים משתמשים בצירוף הזה גם: "להיכנס הביתה, להירגע, לחבק את המשפחה וליהנות מהאווירה המיוחדת שמזגני אלקטרה יוצרים עבורכם."

על כל פנים, אין כאן מסקנה גורפת. מה שברור הוא שהמבנה לחבק+משפחה נוטה לטובת המובן המטאפורי; בשאר השפה מוקדם לומר שהפועל לחבק מאבד את מובנו המילולי, בין היתר משום שזה פשוט פועל נפוץ מאוד. אבל לפחות ברור לנו למה האוניברסיטה לא חיבקה בשלט את משפחות הבוגרים.

Read Full Post »

שוב עידוק מציל את בלוגנו מבצורת ארוכה מדי:

והפעם אפילו סימנתי את מה שנדבר עליו

נכון, נרג כתבו בתחילת הכתבה "הקרע שובר שיאים חדשים", וכל-כך עפו על עצמם שגם חזרו על זה בכותרת המשנה: "המתיחות שוברת שיאים חדשים". אך מה זה, בעצם, לשבור שיא חדש? מבחינה סמנטית טהורה, מדובר או בשטות או בהפחתת העוצמה: אם השיא החדש הוא זה שנקבע הרגע, הוא לבטח לא נשבר באותה הזדמנות ממש. ואם מדובר על שיא חדש במשמעות של שיא שנקבע לאחרונה, זהו הישג פחות מרשים מלשבור שיא ותיק, הלא כן?

הצורה לבטח אינה זרה לרשת דוברת-העברית, ודי להביא (לצורך האיזון) את חטאיו המקבילים של טמקא. ומה גורם לשגיאה המוזרה הזו לקרות? ההסבר הסביר הוא כנראה עירוב ביטויים: "שבר שיא" ו-"קבע שיא חדש". שניהם בעלי אותה משמעות, אך שניהם מוכרים בערך באותה מידה. ודוק: בגוגל נגרמז "קבע שיא" מפסיד ל-"שבר שיא", שבתורו מפסיד ל-"שיא חדש". מה שמראה שבאמת הביטוי המעורב מאחד חלקים נפוצים מתוך ביטויים ארוכים יותר, ויש בכך מידה של הגיון (מחקרי, כן? הסמנטיקה אבדה לבלי שוב).

כאן בפירוש מדובר בתקלה (או בתופעה שמקורה בתקלה, בכל אופן), וראינו אחת דומה לא מזמן, אך במקרים יותר מעניינים קשה להחליט האם יש מודעות עצמית. כך, למשל, בעירוב מטאפורות. הנה שני אוספים מופלאים מהרשת, של מקרים בהם הדובר מתחיל מטאפורה אחת ומסיים בשניה, ולעיתים באופן שממש סותר את עצמו (ברמת המשמעות המילולית). נביא דוגמא מ-"כן, אדוני השר", תוכנית שעשתה קריירה מעירוב מטאפורות:

Jim Hacker: If I can pull this off, it will be a feather in my cap.
Bernard: If you pull it off, it won't be in your cap any more.

אח, הומור בריטי. לקוח מטיויטרופס, אתר שאם עוד לא נתקלתם בו אז עכשיו סוף-השבוע שלכם בסכנה ממשית.

בעברית הצלחתי למצוא דוגמא משובחת אחת בלבד (יש את חצי-המקרה הזה מלפני חודשיים, וחצי-המקרה הזה שקדם לו), אבל עיניי בהחלט יהיו כרויות מעתה. אתם יותר ממוזמנים לשתף כאלה בתגובות, אבל אל תתחילו לי עכשיו עם סתירונימים, עצטרובלים או ביטויים שמשתמשים בהם בהקשר לא נכון.

שבת שלום.

Read Full Post »

נפתח ישירות עם אבחנתה של דורה קישינבסקי על מצב הכותרות בעיתוני ארצנו:

מקף מעריב, ש"ע: המקף שבא באמצע כותרת כדי להתאים את טון הידיעה לגיל המנטלי המשוער של הקורא. "שמע שאשתו מוצצת לאחיו — וירה בה עם אקדח גדול!"

בהיעדר הזמן והמשאבים הנדרשים למחקר מעמיק יותר, אנסה לענות כאן על שתי שאלות: ראשית, מה מאפייניו של מקף מעריב? ושנית, האם זוהי תופעה חדשה?

מקף מעריב – קווים מפרידים לדמותו

מפתה לחשוב שהמאפיין הטכני הבולט ביותר של מקף מעריב הוא היותו מקף, אך למעשה מדובר בקו מפריד, משום שמקף מחבר בין שתי מילים (בית-חולים) בעוד קו מפריד מחבר בין שני חלקים של אותו המשפט. בגלל שלא עושה רושם שזה מפריע לרוב דוברי העברית, בגלל שדורה בחרה את השם ובגלל שספק אם העורכים היצירתיים מודעים להבדל, ניצמד למקף.

מספר דוגמאות למקפי מעריב:
(1) המורה צייר עם התחת – ופוטר [10/1/07, נרג]
(2) סבתא האשימה החבר ברמאות במונופול – ודקרה [29/10/11, טמקא]
(3) רצח נער בן 16 "בשוגג" – ונשלח למאסר עולם [13/11/11, וואלה]
(4) חגג את חג הקורבן – ונורה בעינו [8/11/11, חדשות 2]
(5) הקיבוצניק הלך לטירונות שמן – ורזה בגדול [16/11/11, מיינט]
(6) המאבטח הלך לקורס הכשרה – וחזר נכה
[8/11/11, מיינט]

ואם לא די בכל אלה:
(7) שחקן רוגבי חטף שבץ – והתעורר הומו [9/11/11, חדשות 2]

נאמנים לדוגמה שהתווה שלום רוזנפלד, אין ספק

נראה לי שהרעיון הכללי ברור, אבל מהו בדיוק המקף הזה? הרי לא כל מקף הוא מקף מעריב – יש קווים מפרידים שזוכים לשימוש נאות, ולפעמים קשה לדעת אם היה נסיון להריץ דאחקה או שהמקף שימש להביע סיבה ותוצאה או חלוף זמן (פועל בניין נפל מפיגום בטכניון – ונהרג, טמקא 30/10/11). אם נתמקד במקף מעריב הקלאסי, ההגדרה המקורית והקולעת של דורה היתה "המקף שבא באמצע כותרת כדי להתאים את טון הידיעה לגיל המנטלי המשוער של הקורא". אין ספק שרוח דחקאית מרחפת על פני הכותרות שדגמתי כאן – אפשר ממש לדמיין את העורך מגחך לעצמו בעוד ידו נשלחת אל אותו מקש קסום מימין לאפס. ננתח:
במשפט (1) המקף מבליט קשר של סיבה ותוצאה, כשברור לכל שלפעולה כגון ציור עם התחת יש השלכות. אולי יש כאן רצון לתת לקורא רגע להתאושש מהמילה המצחיקה "תחת" (ובגרמנית הקו המפריד באמת נקרא 'קו-של-מחשבה', כלומר הוא נותן לנו רגע להרהר במה שקראנו).
במשפט (2) המקף יוצר הפוגה דרמטית כדי להעצים את האפקט. אם לא די בכך שלְסבתא(!) יש חבר(!!) והיא משחקת מונופול(!!!), באה הסיפא המפתיעה: ודקרה!!!!
משפט (3) אולי נראה במבט ראשון כקו מפריד תמים, אבל סבורני שהמרכאות סביב המילה "בשוגג" מסגירות את ההתייחסות הספקנית של העורך, כאילו הוא רומז לנו הקוראים: "בשוגג, הא? הראנו לו מה זה בשוגג!".
ממשפט (4) ברור שערבים עם רובים זה מצחיק.
חשבתם שערבים זה מצחיק? חכו חכו, משפט (5) מביא אותה בילד שמן שהוא גם קיבוצניק.
משפט (6) לא רק מספר סיפור משעשע ומבדר לכל המשפחה אלא גם מזכה אותנו במשחק מילים מבדר. אחח, לו רק עזריאל קרליבך היה חי היום.
ואם המשפט הקודם היה גורם לעזריאל קרליבך להתמוגג, משפט (7) הוא ודאי עדות נצחית למורשתו של דב יודקובסקי.

זוהי כמובן דגימה אקראית למדי של מקפי מעריב – אני לא מתיימר להגיש ניתוח כולל ואחיד של התופעה. בן לי שאל אותי, למשל, אם "בשעת מלחמה – ערביי יפו יתקפו את תל אביב" זו דוגמה למקף מעריב. אני חושב שכן, אבל קשה לי לומר. כאמור, לפעמים מקף הוא רק מקף ("ניהל קרב קשה בלבנון – ומונה למפקד חטיבת גולני", וואלה, 5/9/11).

משהרעיון הכללי הובן, ראוי לבדוק אם אני לא נטפל למעריב על לא עוול מיוחד בכפו. אולי עורכינו משתמשים בתרגיל הזה מקדמת דנא? האם אשליית הטריות מרימה את ראשה הנפשע וגרמה לדורה לדמיין צל מקפים כמקפים?

מקף נרג', מקף מעריב, מקף טמקא, מקף הארץ

התשובה הקלה היא שקשה לדעת. קשה לחפש מקפים במאגרים היסטורים וקשה לחפש מקרים בהם העורכים ניסו להתחכם. ברם, בן לי הצליח לדלות את שתי ההופעות הבאות מארכיון העיתונות העברית ההיסטרי:
לקה בשבץ – ומת [מעריב, 2/5/1965]
חיפשו לשווא אמבולנס ליולדת – הוולד נחנק ומת [מעריב, 10/6/1966]

מה אפשר להסיק מכך? אני לא בטוח. תחושת הבטן שלי היא שדורה בכל זאת צודקת ומדובר בתופעה חדשה יחסית, אבל אין לי הוכחות כמותניות כרגע (ובטח גם אף פעם לא יהיו). מה שכן, המקף אינו מנת חלקו של 'מעריב' בלבד; ראינו ששאר האתרים טעמו מטעמו המשכר של המקף, אם כי עושה רושם ש'הארץ' נפגע פחות מהאחרים. שימו לב לאיפוק המקפי בכותרת חשבה שהיצירה היקרה היא כתם, והרסה אותה, ['הארץ', 5/1/2011], אולי בזכות מדריך הסגנון שלהם.

ניסיתי למצוא תופעה מקבילה באנגלית אבל לא הצלחתי בינתיים. זהו. ניסה לסכם את הפוסט – והחליק על קליפת בננה.

[ת' ללב]

Read Full Post »

הטרגדיה של מורן היא שהיא התחתנה עם בלשן. ראיתם כבר שאני מנתח את שפתה פה ושם, אך זה בהחלט לא היה המקרה הראשון. כבר בשנת לימודיי הראשונה בחרתי לבצע מחקר לשוני קטן בהשראתה. אציג אותו לפניכם באיחור אופנתי של ארבע שנים, ואת הטוויסט הקטן שמצאתי באיחור של שנתיים. ככה זה עם טיוטות בדגש קל. הן נרקבות במכבש של וורדפרס עד שהן מתחילות להסריח, ואז ממשיכות להרקיב.

טוב, הגיע הזמן להגיד לכם (לפחות לאלה מכם שלא קוראים כותרות) במה דברים אמורים. חשבו לעצמכם בלב מה דעתכם על המשפטים/צירופים הבאים:

  1. רצתי קצת יותר מהר ממנו.
  2. רצתי מעט יותר מהר ממנו.
  3. אני קצת מבולבל.
  4. אני מעט מבולבל.
  5. יש בספר הזה קצת עמודים.
  6. יש בספר הזה מעט עמודים.
  7. יש בבאר קצת מים.
  8. יש בבאר מעט מים.
  9. יש לו לא קצת כסף.
  10. יש לו לא מעט כסף.
  11. הלכתי קצת.
  12. הלכתי מעט.
אצלי לפחות, משך כל שנותיי השיפוטים היו ברורים למדי: 1, 3, 6, 7, 10, 11 תקינים. 2, 4, 8, 12 תקינים אך מליציים (אני לא הייתי אומר אותם בשיחה יומיומית). 5, 9 לא קבילים. כיוון שהמשפטים הזוגיים כולם משתמשים במעט והאי-זוגיים בקצת אפשר לסכם ולומר שמעט אפשרי בכל ההקשרים, אך לפעמים עדיף קצת, ואילו לקצת יש מגבלות שלמעט אין. אם נפרק את זה עוד קצת מעט: שמות-עצם בלתי-ספירים (כמו מים) מעדיפים קצת. כך גם שמות תואר, כולל ערכי השוואה (מבולבל, יותר מהר), ופעלים (כמו הלכתי, כלומר קצת עדיף בתור תואר-הפועל). שמות עצם ספירים (עמודים) ושלילה מחייבים מעט. עד כאן שיפוטיי, וסביר להניח שחלקכם מנענע כעת את ראשו באי-הסכמה, וזה מצוין כי אחרת לא היתה לי תופעה לחוקרה. ספציפית, אני מניח ש-5 נשמע בסדר לכם החולקים.

מעבר לשיפוט האישי

כמו תמיד ברגעי משבר, פניתי לתנ"ך. מתברר שקצת אינה מילה תנ"כית (מופיעה רק בספרי דניאל ונחמיה הארמופילים), ומעט נמצאת לרוב בהקשרי שמות-עצם בלתי-ספירים, פה ושם גם עם ספירים ("מעט שנים") וכתואר-הפעל ("קצפתי מעט"). אם נסיק מכאן שקצת היא תוספת חדשה שכובשת לה אט-אט תפקידים נוספים מתוך אלה של מעט, נקבל שההתפתחות האחרונה היא רק עוד מעוז של מעט שנכנע, שזה תהליך דיאכרוני (=על-פני זמן) מתקבל על הדעת.

במעבר חד, הדבר השני שבדקתי היה ספירות-גוגל (2008, להזכירכם. אל תנסו זאת בבית). היחס מעט/קצת היה 0.43, אז השתמשתי בו כבסיס להשוואה. והנה התוצאות: קצת ניצח כשהופיע לפני שם-העצם הבלתי-ספיר כסף (0.012 מעט/קצת) ובעמדת תה"פ אחרי הלכתי (0.039), כצפוי. מעט ניצח לפני שם-העצם הספיר אנשים (7.92), כצפוי, ולפני מדי ומאוד (13, 30.64 בהתאמה), כנראה בהשראת ביטויים קפואים כמו "מעט מדי, מאוחר מדי". מקרים אחרים הראו יחסים בין 0.23 ל-1.83, ובהתחשב במדיום החלטתי שזה לא החלטי מספיק. בינתיים נראה שגוגל מסכים איתי מלבד העובדה שכל הצורות הופיעו, רובן יותר מאלף פעמים. האם משפטים 5 ו-9 קבילים?

לפחות 5 כן, אם נשאל את מורן. מזה בכלל התחיל כל הסיפור. פניתי למשאל. שלחתי שאלון למכרים מקבוצות גיל וגיאוגרפיה שונות בשביל לבדוק האם הקבילוּת הלא-מוכרת לי של קצת היא עניין של ניב מקומי (מורן מושבניקית) או אולי משהו חדש (מורן צעירה ממני בשנתיים שלמות). השאלון כלל זוגות מתוך המשפטים לעיל ועוד כמה דומים, והנשאל התבקש למחוק את המשפטים שאינם תקינים בעיניו ולציין אם שני המשפטים תקינים אך משמעותם שונה.

מתוך 30 נשאלים, 24 ומעלה הסכימו על רוב הצורות שציינתי לעיל כמקובלות עליי וכן על 8 ו-12 (שציינתי כמליציות). את 2 ו-4, שציינתי כמליציות, 22 ציינו כתקינות. אחד בלבד ציין את 9 כקביל, וההתפתחות המעניינת ביותר היתה קבוצת משפטים ש-6-11 נבדקים (תמיד מתוך אותה קבוצה של 11 נבדקים) ציינו כתקינים: "אתה ישן קצת מדי", "אכלתי אתמול קצת מדי", "יש בספר הזה קצת עמודים". כלומר, קצת לפני תואר-הפעל "מדי" ולפני שמות-עצם ספירים. יש וריאציה דקדוקית לקצת. (לא היו שום תוצאות באמצע, כלומר 2-5 מסכימים או 12-21 מסכימים)

מיהם הדוברים שהסכימו לצורות שאני פחות אהבתי? המדגמים לא היו גדולים מספיק כדי לומר חד וחלק. אך אף נשאל מבוגר (גילאים 35-55) לא קיבל את "אתה ישן קצת מדי", לעומת שישה צעירים (18-25), מה שמוביל אותי להאמין שהמשמעות הנוספת של קצת היא באמת חדשה. [3 מתוך 6 לא-עירוניים קיבלו את "יש בספר הזה קצת עמודים" לעומת 5 מתוך 24 עירוניים, אבל לך תגיד משהו על סמך מספרים כאלה. בטח כשפרופורציית הגילאים אינה בלתי-תלויה בעירוניות הנשאל. למגדר, אם היה מי שתהה, היתה אבסולוטלי אפס השפעה על השיפוטים.]

כמה הערות שעלו מהנשאלים (הנה הרסתי לכם תגובות, מואהאהא), המעניינת ביותר בסוף:

  • "זוז מעט שמאלה" נתפסת כבקשה, אך "זוז קצת שמאלה" כפקודה.
  • "יש קצת עמודים בספר" יכול להתפס כציניות (!)
  • סדר מילים: עדיף להגיד "אני קצת מאחר", לעומת "אני מאחר מעט". פייג'ינג פרופסור צוקרמן.
  • שני נשאלים טענו בתוקף שבבאר עם "מעט מים" יש יותר מאשר בזו עם "קצת מים". אבל התובנה העיקרית לגבי זה היא דווקא:
  • "יש בבאר קצת מים" בא בסיטואציה בה אולי ציפינו שהבאר תהיה ריקה. "יש בבאר מעט מים" בא בסיטואציה בה ציפינו שבבאר יהיו יותר מים. המשמעות הבסיסית אולי זהה, הפרגמטיקה הפוכה. אני סומך ידיי על התחושה הזו, ומציע אותה כחומר למחשבה: קצת נכנס לשפה, ובמקום לקבל אותו כמילה נרדפת פשוטה למעט, השפה אמרה לו "הלו! תן ערך מוסף! תעבוד קצת!". והשאר היסטוריה.

אפילוג

והרי הטוויסט שהבטתחי בהקדמתי הטרחנית. הביטו בכתבה עתיקת יומין זו של יואב קרני, וושינגטון. אדם עם שפה עשירה ומסוגננת מאין כמוה, שאפילו מנקד כראוי ולא תטעו בו במניירות של צעירים פוחזים. ומה מופיע שם, במרכז המאמר המקושר? לא פחות מהציטוט הבא:

חמתם של הדמוקרטים, וגם של קצת מאוד רפובליקאים, בערה בהם להשחית.

טן טן טן!!! "קצת" המתייחס לשם עצם ספיר, ואפילו "קצת מאוד"! הגם בארזי מחוז קולומביה נפלה שלהבת? נשאיר את מזועזעי הנוער-של-היום עם חלומות הבלהות.

Read Full Post »

Older Posts »