Feeds:
פוסטים
תגובות

Archive for the ‘פוסט אורח’ Category

[פוסט זה הוא פוסט חצי-אורח בשיתוף עם לימור נעמן]

חזרתיות בשפה היא תופעה מעניינת. דוברים יכולים לחזור על משפט שלם, אולי באינטונציה שונה, כדי להבהיר שהם עומדים לחלוטין מאחורי הרעיון שהם מבטאים (היא היתה שלך עוד בשלום, ג'רי. היא היתה שלך עוד בשלום). אם נרד לקומת המרתף, יש מילים שמכילות רצפי צלילים חוזרים, נניח כלבלב או צהבהב בעברית, באופן שיש לו משמעות מסודרת (כאן – הקטנה או החלשה). בעברית אולי זה לא ממש פרודוקטיבי (כלומר, מבנה שגם מילים חדשות לחלוטין ישתלבו בו בהקשרים חדשים לחלוטין, והמשמעות תהיה צפויה), לפחות לא על כל מילה (מחשבשב כספסף? כאילו, איחס?), אבל יש שפות כמו אינדונזית בהן זה ממש חלק מהדקדוק, במקרה שלה – ריבוי (kura – צב. kurakura – צבים). כשזה ברמת הבפנוכו של המילה כמו כאן, בלשנים קוראים לזה רדופליקציה (reduplication), ואנחנו משוכנעים שיש שם בדיחה מודעת לעצמה על התי"מ שהביטוי יוצר [למיטיבי לכת, יש את המאמר שלוקח את המשחק הזה עד 11 – רה-רדופליקעיישן לאלעק מאראנץ].

בין שני אלה, יש גם תופעה בשם ראיטרציה תחבירית (syntactic reiteration), שבה חוזרים על מילה בודדת באופן שמייצג סמנטיקה מסובכת יותר, סמנטיקה ששפות אחרות כנראה יבטאו באמצעות הרכב תחבירי סטנדרטי. באנגלית, למשל, ניתן לחזור על מילה כדי לנתק ממנה משמעות מטאפורית או כדי להעצים משמעות בסיסית שלה. תחשבו על הציטוט הנפוץ בסדרות נעורים אמריקאיות – Do you like him, or do you like-like him? האם את משתמשת במובן הלא-מחייב של "בסדר לי להיות בסביבתו", או שמא החיבוב שלך נושק לתחום הרומנטי? וגם – What kind of sandwich do you want – like a hamburger, or a sandwich-sandwich? האם האידיולקט (ניב אישי) שלך הוא מאלה שכוללים את ההמבורגר בקטגוריית הכריכים, או שהתכוונת שאזמין לך סנדוויץ' פרוטוטיפי שמורכב מממרח ודברים-חתוכים-דק בין פיסות לחם בלבד?

sand

מה הוא רוצה מאיתנו זה עם הסנדוויצ'ים שלו. מקור: טוויטר

בעברית יש (גם) את העניין הזה של ההעצמה – הלילה הוא לפעמים שחור ולפעמים שחור-שחור, תבשילים מקראיים הם לפעמים האדום האדום הזה, הגבר הסטריאוטיפי הוא לעתים גבר-גבר. אתה אוהב אותה או אוהב-אוהב אותה? אבל בעברית עוד נעסוק.

יש שפות שבהן לטקטיקה הזאת יש משמעויות יותר מרוחקות, כאלה שיוצאות מתחום המילה עצמה. למשל, באיטלקית סיציליאנית ראיטרציה יכולה לסמל העצמת פעולה:

האיש מדבר-מדבר

במקרה הזה הכוונה היא שנושא המשפט מדבר יותר מדי, או שהוא מזיין את השכל בכישרון רב. עוד שימוש למבנה הזה הוא במיקום אירוע או מאפיין כלשהם על שטח נרחב:

חיפשתי אותך שוק-שוק

משמעו חיפשתי אותך בשוק, אבל גם חיפשתי אותך בכל השוק. עוד דוגמה היא "יש לו פרצוף פצעים-פצעים" – כל הפרצוף שלו מלא פצעים (אפשר לראות את זה גם בעברית תלמודית: "בשרו נעשה חידודים חידודים").

אבל אנחנו בתוך עמנו חיים (לפחות כשאנחנו לא בלימודים), ועברית מודרנית כפּרה עליה יצקה סמנטיקה מעניינת אף היא אל תוככי הראיטרציה התחבירית (בנוסף על אופציית ההעצמה שהזכרנו קודם, שדי תחומה לתבנית אינטונציה מאוד מסוימת, בה מדגישים את המילה שאינה הראש התחבירי של הצירוף; ובנוסף על הביטוי הקפוא אחד-אחד בהוראתו הלא-נפוצה מדי של "לקחת פרטים משתי רשימות לסירוגין").

המשמעות המוכרת, והפרודוקטיבית, והמגניבה, היא של "אחד-אחד", מה קוראים ביידיש וואן ת'ינג אט א טיים [1]. כך, אם נאמר "עברתי על טיים-הליין של חידושי הניו יורק טיימס ציוץ-ציוץ", תהיה ברורה הכוונה "עברתי על כל ציוץ שם באופן פרטני, אחד אחרי השני". אם נאמר "אכלתי את האורז גרגיר-גרגיר", מתקבלת התמונה של אכילה מאוד איטית, כל פעם יש לי רק גרגיר אחד בהפה.

cows

פרה פרה (מקור: פליקר)

שימו לב שהיו כאן שני מרכיבים למשמעות. האחד, הכל דבר בתורו, "פרה פרה" אם תרצו, הוא בלתי נמנע. זו מטרת התופעה. כפועל יוצא, שם העצם החוזר חייב להיות ספיר, בן מניה, אחרת לא יהיה איך לעבור עליו ("שחיתי לאורך הבריכה מים-מים"???). השני הוא השלמות, או אולי יסודיות, של הפעולה המתבצעת, ככל שהיא נתונה בזמן עבר. יכול להיות שלא הספקתי הכל, אבל אז חובה עליי לציין זאת, ואפילו זה לא תמיד יספיק. "(אני עובר / ?עברתי) על טיים-הליין של שמעון ריקלין ציוץ ציוץ, בינתיים הגעתי רק עד מאי 2018". "?הילדה אכלה את האורז גרגיר-גרגיר עד שנמאס לה".

הטריגר לזה הפוסט הוא שזיהינו משמעות קשורה לזו של אחד-אחד, אבל איכשהו קצת שונה: כשהאלמנט החוזר הוא יחידת זמן, יש פתח לסמנטיקה אחרת. כשאני אומר "יום יום אני צריך להתמודד עם מה שעשיתי", אין פה באמת משמעות בדידה של אקט יומי, ומצד שני לא באמת משתמע שבכל יום ספציפי יש רגע ניתן לזיהוי שבו אני מתמודד עם אותו מעשה. הכוונה היא שבאופן כללי, מצב הנפש שלי הוא כזה שמכיל התמודדות, ואין חופשה מהנושא. אם משהו יזכיר לי את העניין, אאלץ להתמודד איתו. אם פספסתי ציוץ באותו טיים הליין, יצאתי טועה. אם פספסתי יום בתהליך ההתמודדות, לא ממש. באותה מידה, יכול להיות שבכל יום בדיד אני מתמודד עם העניין פעמים רבות. [במאמר מוסגר, לפעמים יום הוא רק יום: זוהר ארגוב תולש מהלוח דף יום-יום. בבירור, זהו אקט שקורה פעם אחת ביום, לא פחות ולא יותר.]

לימור מציעה פתרון לפלונטר: אם אפשר לתאר את טיים-הליין כמורכב ממקטעים של 280 תווים (גג!), כך אפשר לומר גם שהשעות ב"אני חושב עלייך שעה שעה" מורכבות כל אחת ממקטעים של שישים דקות – בפועל גם כל ציוץ נקרא על ידי יובל מילה מילה. במובן הזה, גם פיד הטוויטר וגם הזמן עצמו הם רצף: אחרי כל דקה באה עוד דקה, ואחרי כל ציוץ בא עוד ציוץ שממשיך אותו. מכאן שאירוע קריאת הציוצים הוא גם חלקיק וגם גל, ואפשר להתמקד בכל אחד מהאלמנטים – הרצף והמקטעים שמרכיבים אותו – לפי מה שמתאים לסיטואציה. התרגיל הסמנטי הזה נקרא refocusing, ואפשר לראות אותו גם באירועים שבהם נוסף פתאום עוד משתתף, כמו במשפט "רגע אחד לא השגחתי עליו והוא רץ לי לכביש". המשתתף הראשי באירוע הוא הזאטוט הנמרץ, אבל המילה לי מאירה בזרקור על הקורבן האמיתי בסיפור הזה: האמא המסכנה שלא מבינה במה חטאה שיש לה ילד כזה.

אז אם נקבל את העובדה שזמן הוא יצור מיוחד ומורכב בעולם המושגים שלנו, ושלא כל הדרכים הזמינות לנו לחלק אותו (לימים, לשעות, לדקות) הן שימושיות בהקשרים כמו "לחשוב על מישהי" או "להתמודד עם משהו", נוכל להבין את הצורך הזה בהגמשת תופעת החזרה, במקום להידרש למשמעות נוספת שלה.

המשך…

Read Full Post »

[פוסט אורח: אייל להמן הוא סטודנט לתואר שני בחוג ללשון העברית באוניברסיטת תלאביב, ובשש השנים האחרונות הוא עובד במכון יואל גבע כבודק חיבורי פסיכומטרי וככותב חומרי לימוד לספרי ההכנה של המכון. בעבודתו זיהה כמה צורות לשוניות שהוא חושד שהולכות ומתפשטות. אלה הרהוריו.]

קצת תולדות: איפשהו בסוף העשור הקודם, אחרי שנים של תלונות מצד מרצים במוסדות האקדמיים, הבינו בוועד ראשי האוניברסיטאות שהסטודנטים אולי מסוגלים לפתח Waze וקופקסון, אבל לכתוב עבודת סמינר בלשון תקינה ומובנת, ובעיקר במשפטים שיצליחו להביע במדויק את הרעיונות שלהם – ובכן, זה כבר סיפור אחר. בליטופים ובגזרים לא מגיעים רחוק, אז הוועד והמרכז הארצי לבחינות והערכה החליטו לשלוף מקל והודיעו שבמבחן הפסיכומטרי ישולב פרק בכתיבת חיבור. בכיר במרכז הארצי הסביר פעם בשיחות סגורות את הרציונל כך: "אם הילדים יהיו חייבים לכתוב – מישהו כבר ילמד אותם לעשות את זה". המישהו הזה הוא כמובן מכוני הפסיכומטרי, והם יעשו מזה אחלה כסף.

למי שלא מכיר, אלה כללי הפורמט: הנבחן מקבל קטע קריאה קצר, בערך בן 10 שורות, ובו מוצגים עמדות ונימוקים בסוגיה מעוררת מחלוקת כלשהי – משיבוט בני אדם ועד המסת הקרחונים. בתוך חצי שעה נדרש הנבחן לקרוא את הקטע, לגבש עמדה משלו ולכתוב חיבור טיעון משכנע שאורכו 50-25 שורות. בקביעת הציון ניתן משקל של 50% לפן התוכני (עקביות, קוהרנטיות, היגיון בריא) ומשקל של 50% לפן הלשוני. מחיבורים לדוגמה שפרסם המרכז הארצי התרשמתי שבשני ההיבטים הגישה שלו די מקילה, אבל שיהיה ברור: עדיין מדובר במטלה מורכבת, ובצדק היא מעוררת חרדה גם אצל כותבים מצוינים.

כשבאים לנתח את השפה של כותבי החיבורים חשוב לזכור שני אתגרים גדולים שהמטלה מציבה בפניהם: מצד אחד מצופה מהם לכתוב במשלב שאינו המשלב הטבעי שלהם, אלא משלב גבוה יחסית, כזה שיעמוד בקריטריוניםנקרא לזה "עיוניים"; מהצד השני נדרשת מהם התמודדות עם לחץ זמן אדיר – בערך 20 דקות מוקצות לכתיבה עצמה. לזה תוסיפו את העובדה שמטרת החיבור היא לשכנע, מה שמעודד את הנבחנים להשתמש בשפה שהיא דמגוגית בהיבט התוכני – ויומרנית ומתייפייפת בהיבט הלשוני, ומכאן קצרה הדרך להתרסקות: רבים מהם עושים שימושים לא מקובלים בביטויים, בצורות ובמבנים תחביריים שנדמים להם כמעידים על יכולות כתיבה גבוהות – ובהיעדר די זמן להגהה ולתיקונים בדרך כלל סופן של הטעויות האלה לבצבץ מבין השורות.

ובדיוק בגלל זה חיבורי הפסיכומטרי הם מעבדה מרתקת לבלשנים, לחוקרי עברית, וכן – גם לקטנונולוגים שאתם כל כך אוהבים. אפשר למצוא בהם את הקלאסיקות המוכרות – עלול/עשוי, כש/ש-, "אני יגיד" וגררות לשוניות מכל המינים והמספרים, והכי חשוב – אפשר לצקצק בין חמש ל-50 פעמים בשעה. אבל מה שאותי עניין הוא מבנים לשוניים שלא נתקלתי בהם לפני כן ושמספר ההיקרויות האדיר שלהם בחיבורים מפתה אותי לחשוב שהם נמצאים כעת בשלבי התפשטות. לענייננו כאן קיבצתי שבעה מבנים וצורות שעניינו אותי במיוחד, ולצורך התיעוד אדגיש רק שבכולם נתקלתי כבר בחיבורי הפסיכומטרי הראשונים, אי שם ב-2012.

יש על: זן חדש של משפטי חיוב מתהלך לו בטבע. אני גדלתי בעולם שבו כשעושה הפעולה מוזכר במשפט מטילים עליו חובה בעזרת "על" ("אם אתה רוצה לנצח, עליך להבקיע") וכשהוא אינו מוזכר מטילים חובה כללית בעזרת "יש" ("אם רוצים לנצח, יש להבקיע"). בחיבורים נתקלתי לראשונה בבן הכלאיים "אם אתה רוצה לנצח, יש עליך להבקיע" ובבן זוגו האוסר "אם אתה רוצה לנצח, אין עליך לספוג". בפעם הראשונה פטרתי זאת כגחמה של נבחן בודד, בשנייה ובשלישית הנחתי שלכיתה שלמה שמו משהו במים, אבל די מהר הבנתי שאין עליי להמעיט בחשיבות התופעה: מאות מקרים של ישעלים ואינעלים נערמו לנגד עיניי. מיהרתי למרצים, שאלתי תחבירנים: מכירים? תקין? עובר? קיים ברובד כלשהו מרובדי לשוננו? מקרא? חז"ל? שירת ספרד? נאדה.

לי יש השערה מרכזית אחת, והיא לא מבוססת, אז קבלו נא אותה כהרהור גרידא: אני חושד שהכותבים הצעירים זוכרים את ההטיה של מבנה החיוב הספציפי בלשון עבר, זה שבו "על" נתמכת עלידי "היה" – "אם רצית לנצח, היה עליך להבקיע". בבואם להשתמש בנוסחה הזו בזמן הווה הם עושים היקש, ואת "היה" ממירים בצורת ההווה "יש": אם קודם היה עליך להבקיע, אך הגיוני שעכשיו יש עליך להבקיע.

כשפניתי לאקדמיה ללשון כדי להישען בתיקוניי על מקור סמכות מוסכם נעניתי שה"יש" מיותרת ושאכן צריך להשמיטה. במסעותיי העצמאיים בספרים מצאתי אילן אחד שהמחפשים אילנות יוכלו להיתלות בו: הבלשן יצחק אבינרי מציין שרש"י נהג לעתים להוסיף "יש" יתרה ולכתוב למשל "יש עליך לעזור". אבל חשוב לי לציין שאבינרי הזכיר זאת כשמנה "זרויות" בלשונו של רש"י והסביר שרבות מהן מקורן בצרפתית. אבינרי עצמו, מהבולטים שבמתקני הלשון העבריים, הציג את ה"יש" הזו כמיותרת. ובלי קשר, משהו בי אומר לי שהחבר'ה האלה בפסיכומטרי לא קוראים רש"י לאור עששית. גם אני לא, אגב.

הרי שושהרי: חשבתי שלכותב עברית מנוסה ברור ש"שהרי" היא מילת קישור המציגה את הסיבה למה שנאמר לפניה, ואילו "הרי ש-" דומה במשמעותה ל"אז" ונוטה לפתוח סיפא במשפטי תנאי או ויתור. במסע ההתפלפלויות שלהם נוהגים כותבי חיבורים להחליף ביניהן: "לא ברור לי למה השתמשת בתנור, הרי שהמיקרוגל מחמם מהר יותר!" ו"אם נתחשב בדעת כולם, שהרי לעולם לא נגיע להחלטה". אני משער שלפחות במשפט הראשון מבין השניים תורם לבלבול הדמיון בין "הרי ש-" ל"הרי", שפירושה "הלוא" ושדווקא כן טבעית למבנה המשפט הזה ("לא ברור לי למה השתמשת בתנור, הרי המיקרוגל מחמם מהר יותר!").

אם כי וכי אם: הביטוי "אם כי" העסיק חוקרי לשון עשרות שנים, והמחמירים שבצקצקנים התייחסו אליו בהסתייגות משום שהוא נולד בתקופה שלאחר התלמוד. הבלשן יצחק פרץ, שפעל באמצע המאה ה-20, אפילו ביקש תחילה לפסול את הצורה הזו משום שהיא אינה מופיעה במקורות ונוצרה לדבריו מתוך טעות. טוב שהיא נשארה איתנו. אני מחבב אותה, ומתברר שגם התלמידים במכונים. יש רק בעיה אחת: אחותה התאומה הלאזהה "כי אם".

כל מתקני הלשון שבהם נתקלתי ורוב המילונים שבדקתי קובעים ש"אם כי" פירושה "אף ש-". בעברית של ימינו אני רואה בה במקרים רבים ממד ניגודי יותר מאשר ויתורי, הווי אומר צורה שפירושה "אבל", "אולם", "אך". כאן היא כבר נוסעת קרוב מדי לנתיב שבו נוסעת "כי אם", הסוחבת את המשמעות הניגודית "אלא", ולא פלא שמדי פעם יש התנגשויות. בחיבורי פסיכומטרי משפטים כמו "קטמנדו אינה בירת הודו, אם כי בירת נפאל" או "הוא כדורסלן זריז, כי אם מעט נמוך" הם חזון נפרץ.

אמנם, אולם והאומנם: בואו ניישר קו – "אמנם" פירושה "נכון ש-", "אכן"; "אולם" היא מילת ניגוד שמשמעותה "אבל", "אך"; ו"האומנם" היא מילת שאלה שבאה בעצם להגיד – "וואלה?". ומכאן, וואלה, איזה סלט. אצל חלק מכותבי החיבורים שלוש המילים האלה הן כמעט בגדר ג'וקר, וכל אחת מהן יכולה להחליף את השתיים האחרות בכל תפקיד ובכל מצב. חשוב לדעת שלפחות לשתיים הראשונות שמור כבוד מיוחד בחיבורי הפסיכומטרי, ולכן תדירות השימוש בהן גבוהה למדי: כדי להפגין מה שנקרא "חשיבה ביקורתית", אחרי שהנבחנים מציגים את עמדתם ומנמקים אותה נוהגים רבים מהם לכתוב פסקה שבה הם מביעים הבנה מסוימת לרעיון שעשויים להעלות תומכי העמדה ההפוכה – ואז מסבירים מדוע בכל זאת לדעתם עמדת הנגד אינה משכנעת דייה. המבנה "אמנםאולם" הוא אם כן מבנה מתבקש כאן, אבל בבואם להשתמש בו עושים הנבחנים שלל המרות: "אולם יש בשיבוט בני אדם סכנות מסוימות, אמנם אני חושב שהן בטלות בשישים"; "אולם איכות החיים של האדם חשובה, אבל גם זו של הפינגווינים באנטרקטיקה"; "האומנם בורקס זה דבר משמין, אבל מלוואח משמין פי 16". החילופים אמנםאולםהאומנם זולגים במקרים רבים גם אל מחוץ למבנה הזה, וכאן פרגמטיקה והיגיון בריא של הקורא כבר לא יעזרו, כי הכותב רוצה לומר דבר אחד – ומדבריו משתמע דבר אחר: משפטים שאמורים לחזק אמירה קודמת נפתחים לפתע ב"אולם", הצהרות שמציגות קביעה ולא שאלה מתחילות ב"האומנם", וסיפות שאמורות לסתור את שנאמר ברישא באות כשבראשן "אמנם". מה המקור לבלבול? אולם ייתכן שהוא צלילי, אמנם יש גם סיכוי שהוא גרפי. אני לא סגור על זה.

הילד הרצה, הילד אינו רצה: טוב, זאת כבר הצהרה משלבית מובהקת. כלומר, ניסיון ל-. את ה' הזיקה ואת מילת השלילה "אינו" תופשים כותבי חיבורים כאמצעי פשוט יחסית להרשים את בודקי המבחן, כי לפחות בעיניהם האמצעי הזה לא דורש הפעלת מחשבה מיוחדת או ניתוח תחבירי משוכלל. דא עקא: בעברית את ה' הזיקה נהוג להצמיד לפועל בצורת בינוני בלבד, וכך גם את הטיותיה של מילת השלילה "אין". משפטים כמו "הבתים החדשים היוקומו אינם יורידו את מחירי הדיור" מעטרים, בהערכה גסה, מבחן אחד מכל שלושהארבעה. חיבורי הפסיכומטרי הם הזירה הראשונה שבה נתקלתי בצורות האלה, אבל מאז הבחנתי בהן לא מעט גם באתרי תוכן גדולים ומוכרים. תופעה מתפשטת או משהו שנמצא כאן כבר די הרבה זמן? באתי רק להצביע, לא לקבוע.

במקורות, דרך אגב, יש דוגמאות לשימוש בה' הידיעה שלא בצמוד לבינוני (בספר עזרא יש "ההרימו", "ההושיב"), ובעשורים הראשונים שאחרי תחיית העברית אפשר היה למצוא בעיתונים ביטויים כמו "השנה העברה". גם לשימוש ב"אינו" לשלילת עבר, עתיד ושֵם יש דוגמאות במקורות (אבינרי מזכיר למשל את "אין המלך יוכל" בירמיה לח), אבל כל אלה חריגים, וודאי שלא תואמים את דקדוק העברית המודרנית.

אותיות הית"ן: על "אני יגיד" שמעתי, אבל "אני הגיד"? "אני הגיע"? "אני הבוא"? בזה לא נתקלתי לפני ההיכרות שלי עם חיבורי הפסיכומטרי, אבל חברים שמלמדים בבתי ספר ממלכתיים סיפרו לי שהם דווקא כן. היפרקורקציה? או אולי התערערות העיצורים הגרוניים הול הובר הגיין?

משום ו-: רבות דיברו המצקצקים על תפקידיה של הו' שמחליפה את ש' – כן נצמדת ל"הואיל", אוליאולי נצמדת ל"היות", בטוח לא נצמדת לכל השאר. אני מודה שאני די מתירני בעניין הזה וחלק מהפסיקות לגבי הו' הזו נשמעות לי כמעט אקראיות, אבל בעולם החיבורים כבר נתקלתי בצורות מתחכמות שגרמו גם לי לזוע בחוסר נחת: "מפני ו-", "כיוון ו-", "משום ו-". אפילו "על מנת ו-" ראיתי. אני חושד שהסכר נפרץ, אז הכינו את שקי החול – שיטפון של וי"וים מגיע בחורף הקרוב. כלומר, ייתכן ו-.

[זה היה פוסט אורח מאת אייל להמן]

Read Full Post »

והרי פוסט אורח מאת רן אתיה, מורה לסינית והאדם מאחורי הבלוג סימנית אחת ביום:


בוא תלמד סינית הם אמרו לי. זו שפה בלי דקדוק הם אמרו לי. מתקדמים בה ממש מהר הם הוסיפו. לא צריך לשנן כלום הם הבטיחו.

לשפה הסינית יצא שם של שפה נורא קשה ללמידה. בעיניי זה מוצדק אבל לא מהסיבות הנכונות. רוב האנשים חושבים שהאתגרים האמיתיים הם הכתב וההגייה, אבל האמת היא ששניהם לא כל כך מסובכים אם לומדים אותם בשיטתיות ובקצב המתאים. מתחת לכתב המפחיד מסתתר המון הגיון ובסוף מגלים שיותר קל להבין סינית מקריאה מאשר משמיעה.

wood

הסיבה האמיתית שהסינית כל כך קשה ללמידה מסתתרת דווקא במה שרבים תופסים כחלק הכי קל שלה – הדקדוק. על הנייר זה נשמע נהדר. אין ה"א הידיעה, אין יחיד ורבים וגם אין זכר ונקבה. אם למדתם להגיד תלמיד בסינית אז למדתם גם לומר תלמידה, תלמידים ותלמידות, וגם התלמיד, התלמידה, התלמידים והתלמידות. ממש מבצע של למדו אחד קבלו שבעה במתנה. בפעלים הדיל הזה אפילו עוד יותר משתלם כי בסינית לא רק שלא מטים את הפעלים לפי מין ומספר, גם הזמן לא בא לידי ביטוי בתוך הפועל אלא מתקיים ברכיבים אחרים במשפט. זה אומר שברגע שלמדתם את הפועל ללכת – you are good to go. אין הלכתי, הלכו, הולכות, נלך, לכו וכל השאר. בסינית גם דוברי השפה וגם עולים חדשים אומרים "אני מחר ללכת עבודה" וזה בסדר גמור.

אם נרצה לתאר את התופעה הייחודית הזו של היעדר הטיות נאמר שבסינית אין מורפולוגיה – כלומר צורת המילים אינה משתנה לפי שיטה כזו או אחרת. אבל מורפולגיה היא רק חצי מהדבר הזה שאנחנו קוראים לו דקדוק. החצי השני הוא התחביר ולכן לומר שסינית היא שפה נטולת דקדוק זה לא מדוייק. כי כשאין מורפולגיה צריך לפצות על כך ואחת הדרכים לעשות זאת היא להקשיח מאוד את חוקי התחביר. מבנה המשפט בסינית מקובע מאוד בהשוואה לעברית ולשפות אחרות. קחו למשל את המילה 'גם', בעברית אני יכול לומר "גם אני רוצה", "אני גם רוצה" או "אני רוצה גם" ואין עם זה שום בעיה. אמנם יש הבדלים דקים המשתמעים מכל משפט אבל כל הצורות תקפות. בסינית לעומת אפשר להגיד רק "אני גם רוצה" וזהו. עוד דוגמה נהדרת שממחישה כמה חשוב סדר המשפט בשפה נטולת מורפולגיה היא המשפט "לי יש" שאם נהפוך את הסדר שלו וננסה לומר "יש לי" בסינית, נקבל "יש אותי" כי בעצם הופעתה לאחר הפועל 'יש' המילה 'אני' הופכת למושא.

אבל תחביר קשיח הוא רק חצי צרה. הבעיה האמיתית בשפה ללא מורפולגיה היא שהכל נעשה, איך לומר את זה – אמורפי. מילים בשפות "נורמליות" הם כמו שולחן מאיקאה. הן מוצר סופי שעבר עיבוד והרכבה, הן מגיעות עם סט תוספות מודולריות במידה ונרצה לערוך בהן שינויים או להניח אותן במקום אחר, יש להן שכבת מגן, הוראות שימוש ואישור של מכון התקנים. מילים בסינית לעומת זאת, הן דבר הרבה יותר גולמי. לא שולחן גמור אלא יותר כמו קרש ממש גדול ורחב. הוא יכול להיות שולחן, והוא יכול להיות גם רק חלק משולחן. תשברו אתם את הראש על איך לאזן אותו.

table

אבני הבניין הבסיסיות של הכתב הסיני הן סימניות. סימניות הן לא אותיות, לא שורשים וגם לא מילים. סינית היא כל כך אמורפית עד שהן מצליחות להיות כל שלושת הדברים ביחד ואף אחד מהם בו זמנית. סימניות פשוט מבטאות משמעות. בואו ניקח למשל את הסימנית 关 שמשמעותה הבסיסית היא לסגור או לקשור. אפשר להשתמש בה כדי לומר לסגור את הדלת (关门) או לכבות את האור (关灯) ואז היא מתנהגת פחות או יותר כמו מילה העומדת בפני עצמה. אבל כאשר מצרפים אותה לסימנית 心 שמשמעותה לב מקבלים את הצירוף 关心 שפרושו הוא לא לסגור את הלב, כי שתי הסימניות האילו יוצרות ביחד מילה חדשה שפירושה אכפתיות.

רוב המילים בסינית מורכבות משתי סימניות או יותר. בדרך כלל הן מתנהגות כמו מילים רגילות אבל יש סוג אחד שפשוט לא מציית לאף חוק מוכר. אני לא יודע אם הוא קיים בשפות אחרות אבל בסינית הוא נקרא 离合词. פירוש השם הוא מילה (词) נפרדת (离) ונצמדת (合) והוא מתאר מילים שמתנהגות כמו אקורדיון. הדרך הכי טובה להבין במה מדובר היא באמצעות דוגמה אז תרשו לי להציג בפניכם את המילה 见面 שפירושה להיפגש. עכשיו תראו משהו מגניב:

meet

ראיתם מה קרה בצעד האחרון? המילה 见面 התפצלה ובתוכה מופיעות הסימנית 过 שמצביעה על כך שהפעולה התרחשה בעבר, וכן הצירוף 一次 שמשמעותו היא פעם אחת. זה קורה בגלל שהמילה להיפגש בסינית מכילה בעצמה שתי ישויות סמנטיות והן 见 שמשמעותה לראות ו-面 שמשמעותה היא פנים. כשאנחנו נפגשים עם מישהו אנחנו רואים את פניו. אם נפרק את המשפט הזה לחלקים הסמנטיים הכי קטנים שלו זה ייצא משהו כמו אני-עם-הוא-לראות-בעבר-אחת-פעם-פנים, אבל תודו שהרבה יותר נוח לתרגם את זה כנפגשתי איתו פעם אחת.

השאלה של האם אנחנו צריכים לראות מילים כגון 见面 כמילה אחת או כשתי מילים נפרדות שפשוט מופיעות בדרך כלל ביחד היא שאלה שמעסיקה חוקרי שפה רבים, וגם אנשי הוראה שתוהים איך להסביר סינית לתלמידים שלהם. השאלה שלי אליכם היא האם אתם מכירים תופעות דומות בשפות אחרות בהן מילה מסויימת יכולה לבלוע מילים אחרות בשלמותן? הדבר הכי קרוב שאני מכיר זה מוספיות תוכיות (infix) אבל לא מדובר במילים שלמות אלא באותיות והברות ללא משמעות בפני עצמן. אולי ניתן לראות את המילה 'להיפגש' בסינית כהרכב ולא כמילה עצמאית? אבל אז המבנה שלו הוא פועל-מושא והוא עדיין מתנהג באופן שונה לחלוטין מהרכבים אחרים שקיימים בסינית (למעשה רוב המילים בסינית הן הלחמים של שתי סימניות). עשר שנים של לימודי סינית למדו אותי דבר אחד וזה שהניסיון לפרק את השפה הזו לפי פרדיגמות הבלשנות המערבית נועד מראש לכישלון. וגם כשזה מצליח  זה דורש ערימות של אקרובטיקה לוגית והתוצאה שמתקבלת מעוותת ברמות. אני כבר מזמן עברתי לגישה הדאואיסטית שאומרת שלא צריך לנסות להבין ולהגדיר כל דבר, אלא פשוט להשלים עם כך שחוסר הוא חלק בלתי נפרד מן השלמות ופשוט לצעוד בנתיב. בינתיים זה עובד נהדר.

אבל ברצינות, מישהו יכול למצוא הקבלה בשפות אחרות למילה שמתנהגת באופן דומה למילה 'להיפגש' בסינית?


היה זה פוסט אורח מאת רן אתיה. רוצים גם לפרסם פוסט אורח? זה קל! השליכו דיסק-און-קי עם הפוסט בפורמט RTF מטיסה טרנס-אטלנטית עשרים דקות מערבית לאיים האזוריים, ומעבורת דגש קל תצא חיש ותאסוף אותו.

Read Full Post »

להלן פוסט אורח פרי עטו של עזר ראסין.

הנשיא השתמש בצירוף סמיכות דו-משמעי והובן בטעות כמי שמאשים את העם היהודי כולו בטרור


המשך…

Read Full Post »

[טור אורח מאת פרופ' זהר לבנת, ראש המחלקה ללשון העברית באוניברסיטת בר אילן ויו"ר ועדת המקצוע ללשון העברית במשרד החינוך. יתפרסם בקרוב גם ב'הארץ']

כחלק מכוונתו של שר החינוך לצמצם את מספר בחינות הבגרות, הוא צפוי להכריז בימים הקרובים על איחוד בין שני מקצועות הבגרות – לשון וספרות. מאחר שאין מדובר כרגע בתכנית מגובשת אלא בכותרת בלבד, לא ברור אם הכוונה היא לאחד בין הבחינות בלבד, או שמא ליצור מקצוע חדש ומאוחד ולבנות גם תכנית לימודים משותפת.

איחוד הבחינות בלבד הוא רעיון חסר שחר שלא יועיל לאיש ורק יזיק לתלמידים. מדובר למעשה בשתי בחינות באותו מועד, בשני מקצועות הנשענים על דרכי חשיבה שונות לחלוטין ומחייבות התמודדות עם סוגים נפרדים של מטלות קוגניטיביות, במסגרת של בחינה אחת. אין בכך כל יתרון, מלבד האפשרות של השר להוכיח כי "צמצם" את מספר הבחינות.

אם מדובר באיחוד ממשי של שני המקצועות, במסגרת תכנית לימודים משותפת ובהוראה משותפת – מדובר במהלך שיהיה בכייה לדורות, מהלך שידרדר את הישגי התלמידים בעברית לשפל שלא היה כמוהו.

אין חולק על כך שמצב לימודי העברית בישראל הוא בכי רע. אין מדובר דווקא בשאלות של תקינות ושל שיבושי שפה, אלא בעיקר במה שקשור ליכולת הבנה והבעה בכתב ובעל פה. המרצים באקדמיה נדהמים בכל שנה מן הירידה ביכולתם של הסטודנטים לא רק להבין טקסט ברמה אקדמית אלא אפילו לנסח רצף של שני משפטים סבירים ולקשור ביניהם באופן משכנע.

ואין מדובר רק באקדמיה. השליטה בשפת האם היא אחד המפתחות החשובים להצלחה בכל תחומי החיים. היא מהותית ביותר להצלחה במקצועות הלימוד בבית הספר, אך היא גם הכלי המרכזי שבאמצעותו אנו מנהלים את חיינו החברתיים והמקצועיים ומשתתפים בחיים הציבוריים במדינה דמוקרטית. היכולת לנסח טענות ורעיונות, להבין את טענותיהם של אחרים ולהשפיע עליהם באמצעות השפה, יכולת זו אחראית במידה רבה להישגים שאנו משיגים בכל התחומים וליכולתנו להשתתף במעגלי חיים רחבים.

כדי לקדם ולטפח יכולות אלה בבית הספר דרוש זמן: יש צורך בתרגול רב והמורים צריכים לקרוא ולתקן טיוטות שוב ושוב. ועוד לא דיברנו על סוגיית ההבעה בעל פה, שהיום כלל לא ניתן לה מקום בבית הספר. לכל אלה חובה להקדיש שעות הוראה מיוחדות. מזה שנים אנו מבקשים משרי החינוך תוספת שעות למטרות אלה. מניסיוננו אנו יודעים שיש קשר ישיר וברור בין התשומות הלשוניות, כלומר למידת העיסוק בשפה בבית הספר, לבין הישגי התלמידים. בשנים שבהן ניתנו שעות נוספות לעניינים אלה, ההישגים בתחום השפה השתפרו באופן משמעותי. שרי חינוך אחדים היו קשובים לכך ואף החלו להתגבש תכניות לקידום הנושא. הרוחות המנשבות כעת במשרד החינוך מנשבות לצערי בכיוון ההפוך.

לפי כל חישוב אפשרי, ברור כי תכניותיו של השר יביאו לקיצוץ נוסף בכל מה שקשור לידע לשוני ולשליטה בשפה. איחוד של שני המקצועות, או אפילו רק של הבחינות, שלא יהיה כרוך בהגדלה של מספר השעות – יביא בהכרח לכך שפחות שעות יוקדשו לעברית. סוגיה חשובה נוספת היא סוגיית המורים: מקצוע משותף פירושו גם הוראה משותפת. התוצאה הטבעית של המהלך הזה תהיה שהמורים לספרות יידרשו ללמד לשון מבלי שזכו להכשרה מתאימה. דבר זה לא יעלה כלל על הדעת. אין שום מוסד אקדמי בארץ שמכשיר מורים לשני המקצועות יחד, ובמערכת החינוך יש מעט מאוד מורים המסוגלים ללמד את שניהם באופן ראוי.

נושאי הלשון חייבים להישאר בידי אנשי הלשון. לא רק בידיהם של המורים, אלא בעיקר בסמכותם של החוקרים ואנשי האקדמיה המומחים לשפה. תכניתו של השר תפקיע מידיהם את האוטונומיה בתחום זה באופן שיגרום לנזק בלתי הפיך. באופן מפתיע, היא מקודמת בימים אלה מבלי להיוועץ כלל באנשי המקצוע – לא בוועדת המקצוע ואפילו לא במפקח הראשי (מפמ"ר) של המקצוע במשרד החינוך, משום שתפקיד זה אינו מאויש מזה חודשים אחדים. התנהלות זו של המשרד מעידה על זלזול בידע המדעי ועל חוסר הבנה מהו ידע דיסציפלינארי. אני תקווה ששר החינוך יוכיח לנו שאין זה כך ושהוא אינו נגד השפה העברית.

[טור אורח של פרופ' זהר לבנת. אתם מוזמנים לשתף את העמוד הזה עם מכריכם/ן בדוא"ל וברשתות החברתיות: http://wp.me/pzkWR-1gv ]

Read Full Post »

[בלה פוסט אורחת בלה גבי סטנובסקי בלה סטודנט לבלשנות בלה באוניברסיטת בת בלה]

לאחרונה נתקלתי ברשת במספר אלגוריתמים לשוניים מעניינים ומוזרים שהוצעו בשפה האנגלית. עניין אותי לנסות ולשחזר אותם עבור השפה העברית. רשומה זו סוקרת את האלגוריתמים, את הכלים החישוביים אשר נעשה בהם שימוש, ומספקת מקבילה עברית שלהם.

NURBLE

במקור

מן הקומיקס המעולה SMBC של הכותב והמאייר זק ווינר (Zach Weiner). בקומיקס מועלים לא פעם רעיונות מתחומים רבים, חלקם דמיוניים לחלוטין, וחלקם מתבררים כפרקטיים למדי.

באחד הקומיקסים הכותב העלה את הסברה כי ניתן לשפר טקסטים פוליטיים ע"י שינוי כל מילה שאינה שם עצם ל-NURBLE. עוקב טוויטר חרוץ לא איחר להגיב עם תוכנה קטנה שעושה בדיוק את זה – מקבלת טקסט, ומחזירה אותו "מנורבל".

הרעיון לא חמק מעינם של הכותבים של לאנגואג' לוג, אלו התייחסו בפוסט שבו הוצעו מספר "מנרבלים" נוספים.

איך זה נעשה

התוכנה הקטנה ששלח העוקב (שנכתבה בשפת PHP) עושה שימוש במשאב חיצוני – קובץ המכיל מאגר מילים וחלק הדיבר שלהם. התוכנה עוברת מילה-מילה על הטקסט אותו יש לנרבל, ובודקת לפי המאגר האם המילה היא שם עצם או לאו – בהתאם היא מחזירה Nurble, או את המילה עצמה.

התוצאה

מעניינת ומשעשעת למדי, ניתן להתרשם באותו הקומיקס מהרצה של האלגוריתם על נאום המצב לאומה של אובמה. באופן מפתיע ניתן להבין את רובו, גם כאשר הרוב המוחלט של המילים "מנורבל".

בעברית

כפי שראינו התוכנה המקורית עשתה שימוש במאגר מילים ממשאב חיצוני. למיטב ידיעתי משאב שכזה לא קיים בשפה העברית. בנוסף, כנראה שנטייתה של השפה העברית לעמימות תחבירית יקשה מאד על שימוש במשאב כזה, גם אם קיים. מסיבות אלו נעשה שימוש במתייג – פונקציה אשר בקבלת משפט מחזירה, בין השאר, את חלקי הדיבר של מילותיו (עוד על כך בהמשך) באחוזי ההצלחה מסוימים. בהינתן פונקציה כזו הפתרון למשימה נעשה טריוויאלי – נעבור על כל המשפטים בקלט, נזין אותם למתייג, ונברור את שמות העצם מתוכם.

התוצאה

התרשמו בעצמכם מ"נירבול" נאומו של יאיר לפיד במליאה:

מקור, ולאחר נירבול.

עינכם הרואות – ה"נארבל" עשה עלייה ל-"בלה", לדעתי גם במקרה הזה ניתן להבין את המסר בקווים כלליים.

נסו בעצמכם

אם אתם מעוניינים לבדוק בעצמכם את ההשפעה של הנירבול על טקסטים אחרים, העלתי מדגים של התוכנה (לאחר הכנסת הטקסט, סמנו את האופציה NURBLE).

אתנחתא – מתייגים, מפיגי עמימות ומודלים סטטיסטיים

בתחום הבלשנות החישובית קיימים מספר תחומים ובעיות אשר נחקרו רבות בשנים האחרונות – רובן בעיות בסיסיות אשר פתרון שלהן יהווה בסיס כמעט לכל מערכת אשר רוצה לעשות שימוש בשפה טבעית. בין אלו ניתן למצוא: תיוג חלקי דיבר (Part Of Speech Tagging), זיהוי ביטויים שמניים (NP Chuncking) וזיהוי ישויות (Named Entity Recognition). קל לראות כי אלו הן אבני הבסיס למשימות "מורכבות" יותר, דוגמת ניתוח תחבירי (Parsing), תרגום מכונה, סיכום אוטומטי, ועוד.

בניגוד למשימות ה"מורכבות", במשימות בסיס אלו קיימת לרוב הסכמה בין דוברי השפה לגבי הפלט הרצוי. כך, כל דובר שפה עברית יסכים כי חלק הדיבר של המילה "רץ" במשפט "גל רץ הביתה" הנו פועל (Verb), בעוד שספק אם קיימים שני אנשים שונים אשר יסכמו את הרשומה הזו לכדי אותו סיכום.

כמובן שבעיות אלו הנן תלויות שפה עד מאד, והאלגוריתמים אשר מנסים לפתור אותן חייבים להתייחס למאפייניה הייחודיים של השפה אליה הם מכוונים פתרונן. למשל אופייה הצירופי (word agglutination) של השפה העברית עלול להקשות רבות על כותבי אלגוריתמים כנ"ל לשפה העברית – אלגוריתמים אלו צריכים להפיג את העמימות באשר היא קיימת לגבי המילים במשפט. אם נסתכל שוב על המילה "רץ" הפעם במשפט "גל הזיז את הרץ למשבצת הסמוכה", ברור כי יש להתייחס למילה רץ בתור שם עצם, בניגוד לפועל שראינו במשפט לעיל – אלגוריתמים אלו יצטרכו לבחור את הפירוש הנכון למילה בהינתן ההקשר המתאים. [ראו גם כאן וכאן – א"ק]

המגמה הבולטת בשנים האחרונות לתקיפת בעיות אלו היא גישה הסתברותית (סטוכסטית). ניתן לייחס זאת להתחזקות כוח המחשוב, לקורפוסים העצומים והבלתי מעובדים (unstructured corpora) של שפה טבעית שמשתמשי האינטרנט מייצרים על בסיס יומיומי, ולאכזבה כללית ממודלים דטרמיניסטיים ו-"שלמים" יותר שהוצגו בעבר.

אלגוריתמים הנוקטים בגישה זו מניחים קיום של מודל כלשהו אשר ממנו מופקים משפטים תקינים בשפה או שבעזרתו ניתן לנתח משפטים בשפה טבעית. כך לדוגמא רשתות נוירונים מניחות קיומו של מודל המפשט את המוח האנושי לכדי נוירונים אשר מופעלים לפי פונקציות הפעלה מסוימות (activation function), ומודלי מרקוב חבויים (Hidden Markov Models) מניחים קיומו של מודל של מכונת מצבים, אשר המעבר בין המצבים תלוי במשפט הקלט ובהסתברות מסוימת.

מודלים אלו נמצאים בבסיס האלגוריתמים הסטוכסטיים. אופיינית, אלגוריתמים אלו יתחילו מתהליך של "אימון" על משפטי קלט משפה טבעית. תהליך זה מטרתו לכייל את הפרמטרים אשר מוטבעים במודל. כך ברשתות נוירונים יכוילו המשקלים אשר ניתנים לכל נוירון, ובמודלי מרקוב חבויים תכוילנה ההסתברויות למעבר בין המצבים.למעשה ניתן לומר כי תהליך האימון מתאים את המודל למשימה הספציפית מולה ניצבים.

לאחר שלב האימון, מפסיקים לכייל את הפרמטרים של המודל ומציגים בפניו משפטים שלא חזה בהם בשלב האימון. בתקווה, המודל אכן יודע להכליל איזושהי תחזית לגבי כלל המשפטים בשפה (או בחלק נרחב ממנה), ולכן יוכל לתת תשובות באמינות מסוימת גם עבור משפטים שלא ראה בעבר.

חלק מן החכמה בכתיבת מערכות שכאלו כוללת את בחירת המודל, אפיון הפרמטרים שלא ישתנו במהלך האימון (לדוגמא, טופולוגיית הרשת במקרה של רשתות נוירונים), ובחירת המאפיינים (features) שיהוו קלט למודל הנבחר.

עבור מימוש שני האלגוריתמים הפשוטים יחסית שמתוארים ברשומה זו, עשיתי שימוש במתייג ומפיג העמימות שנכתב על ידי מני אדלר מאוניברסיטת בן גוריון. משפטים שלמים מן הקלט מוזנים אליו, ובתמורה מקבלים עבור כל מילה בין השאר את חלק הדיבר שלה (בו כבר עשינו שימוש עבור אלגוריתם NURBLE) את הבניין, הזמן, המין, הגוף, ואת צורת הריבוי שלה – בכל אלו נעשה שימוש באלגוריתם הבא שיתואר.

Jailbreak the Patriarchy

במקור

במקרה הזה מדובר בתוסף לשוני מוזר לדפדפן chrome שמתיימר לשבור את הפטריארכיה השלטת ברשת.

התוסף מחליף בטקסט דפי האינטרנט שמות גוף זכריים לנקביים ולהיפך. בנוסף הוא מחפש ביטויים זכריים מסוימים ומחליף אותם במקבילה הנקבית שלהם, ולהיפך. כך לדוגמא "he loved his mother very much" יהפוך ל-"she loved her father very much" ו-"the patriarchy also hurts men" יומר ל- "the matriarchy also hurts women".

איך זה נעשה

לפי תיאור התוסף, נראה כי מדובר במשימת "חפש-החלף" פשוטה יחסית: התוסף עובר על הטקסט בדף, ומחפש ביטויים שנקבעו מראש. ברוב המשפטים אכן מושגת החלפת מין (gender swapping, לפי הכותב), זאת מכיוון שרוב חלקי הדיבר בשפה האנגלית הם ניטרליים מבחינת מין.

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

(אובמה נפגש עם קבוצת ה-KINGS/QUEENS, הכתבה המקורית (מימין) מול התוצר של התוסף (משמאל). מקור

בעברית

בדומה לאלגוריתם הקודם, נראה כי הגישה שננקטה במקור לא תספק מענה הולם בעברית. נסתכל על הדוגמא שנתנה בחלק הקודם:

  • גל רץ הביתה.
  • גל הזיז את הרץ למשבצת הסמוכה.

נניח כי נבצע משימה של חיפוש והחלפה, ונרצה להחליף את "רץ" ב-"רצה", נקבל:

  • גל רצה הביתה
  • * גל הזיז את הרצה למשבצת הסמוכה

ברור כי זוהי אינה התנהגות רצויה, וכאמור, בשפה האנגלית לרוב לא נתקלים בקשיים שכאלו.

הדרך בה נקטתי לפתרון הבעיה הנה שימוש במתייג שהוזכר לעיל – ממנו דליתי עבור כל מילה בקלט את חלק הדיבר שלה, בהתאם הפעלתי עליה פונקציית החלפת מין. אתאר את הפונקציות עבור חלקי הדיבר שם-גוף ופעלים:

שמות גוף:
בהינתן הידע כי מילה מסוימת היא שם גוף, והעובדה כי שמות הגוף היא קבוצה סגורה וקטנה יחסית של מילים, ניתן להשתמש בטבלה פשוטה ולהמיר "הוא" <-> "היא", "הם" <->"הן" וכיו"ב.

פעלים:
בהינתן הפרמטרים הבאים עבור מילה: בניין, זמן, מין, גוף, ואת צורת הריבוי שלה. ניתן להשתמש בחוקי התחביר העברי, לגזור את השורש ולשתול אותו במקבילה הנקבית / זכרית.
בנוסף לאלו, הכנסתי גם רשימת ביטויים בעלי מין אותם האלגוריתם מחליף, בדומה לתוסף המקורי – "אמא" <->"אבא", "פטריארכיה" <-> "מטריארכיה" ועוד.

התוצאה

מעניינת, אך רחוקה מלהיות מושלמת. אם להמשיך באותו קו של דוגמאות, בחרתי את פוסט הפייסבוק שמשום מה התפרסם בזמן האחרון על ריקי כהן הדמיונית, וזוהי התוצאה: "אני רוצה שנדבר על מר כהן". ניתן לראות כי ביטויים רבים מבלבלים את התוכנה, אולם ברגעיה היפים יוצאים משפטים לתפארת מרב מיכאלי.

נסו בעצמכם

גם בתוכנה זו ניתן להתנסות בהמרת מינו של כל ביטוי העולה על רוחכם – כאן (לאחר הכנסת הטקסט, סמנו את האופציה Jailbreak).

[בלה בלה רשומת אורחת בלה גבי בלה בלה בלה פוסט אורחת בלה צרו בלה קשר בלה בלה דרך הטופס בעמוד בלה בלה]

Read Full Post »

[חלק א' של הפוסט מופיע כאן]


בפרק הקודם כתבתי על העקרונות של משקל הסגוליים. בצורת הנקבה החיים מעניינים אפילו עוד יותר.
קודם כל, ביחיד היא בכלל לא לובשת סגול. במקום זה היא פותחת בתנועה קטנה (פתח / חיריק / סגול) ואחריה שווא. אם יש לה גם צורת זכר (כלב-כלבה, צדף-צדפה) הזיהוי עוד ברור. אם לא (שִֹמְלָה) – רק צורת הרבים מסגירה אותה. כזכור, בצורת הרבים של הסגוליים אין רק סיומת של Xים/Xות, אלא שינוי כל המילה כך שהיא מתחילה בשווא ואחריו קמץ (שְֹמָלוֹת). הבעיה היא שבנקבה צורת הריבוי הרגילה (הוספת Xות בסוף המילה) מתגלגלת לנו באופן אוטומטי כמעט. לא נאמר כֶּתֶרִים, כי זה מאריך את ההגייה, אבל באופן טבעי נהפוך מַלְכָּה למַלְכּוֹת, מה גם שמילה זו מוכרת לנו מצורת הסמיכות. יוצא שרק בחלק מה'סגוליות' אנחנו מקפידים על צורת הריבוי התקנית. משום מה, דְּמָעוֹת או סְפָרוֹת עוברות חלק, אבל לְשָכוֹת, חֲבָרוֹת ועֲמָדוֹת כבר נשמעות, אפעס, קצת מאולצות, ועל כְּלָבוֹת בכלל אין מה לדבר.


הפער הזה בין צורת הריבוי התקנית, שנשמעת לנו מלאכותית,  לבין צורת הריבוי הרגילה, שדווקא היא מצלצלת לנו נכון, בולט בעיקר בצורת הנקבה של משקל קֹטֶל.לפי התקן היא צריכה להשתנות ביחיד ל-קָטְלָה  (קמץ קטן בהתחלה) וברבים ל-קְטָלוֹת. בעברית המוקדמת, זו של המקרא ושל חז"ל, אכן יש הקפדה על כך: הנקבה של אֹרַח היא אָרְחָה, וברבים אֳרָחוֹת ("בִּימֵי יָעֵל חָדְלוּ אֳרָחוֹת" – שירת דבורה), והנקבה של חֹרֶב היא חָרְבָּה וברבים חֳרָבוֹת (כמו בביטוי 'עִיֵי חֳרָבוֹת'). הצורה הזאת כל-כך לא נוחה להגייה, עד שבעברית המודרנית היא נשמטה לחלוטין, ואנחנו משתמשים רק בצורת הרבות הרגילה (קֹטְלוֹת). למשל: צורת הנקבה של אֹפֶן היא אָפְנָה, וברבים אֹפְנוֹת. כנ"ל עם תֹּכֶן-תָּכְנָה-תֹּכְנוֹת (ולא אֳפָנוֹת ו-תְּכָנוֹת, כפי שהיה צריך להיות לפי התקן)


ואיך קרה שדווקא צורת קֹטְלָה הפכה להיות מזוהה עם עולם המחשבים?
קרה כאן תהליך מעניין: כשעולם מונחי המחשב בעברית היה בחיתוליו, נוצקו שתי המילים היסודיות –  תָּכְנָה וחָמְרָה – במתכונת הנקבה של הסגוליים תֹכֶן וחֹמֶר (אם כי צורת הריבוי, כאמור, היא רגילה). בהמשך, כל המילים שבאו בעקבותיהן חיקו אותן. אבל זהו חיקוי מזוייף – הוא משחזר רק את צורת ההברות, לא את המהות! הרי אף אחת מהמילים אינה צורת הנקבה של הסגוליים. החיקוי ההברתי הוא שהפך את צורת קֹטְלָה למשקל בפני עצמו, המקבילה העברית לסיומת ware  האנגלית.


והנה לנו דוגמה קלאסית לפלא של יצירת מילים בשיטת שורש-משקל, עליה כתבתי במספר הזדמנויות ב"דורבנות", למשל כאן, וכאן. המדהים בתופעה הוא שברגע שמשקל מסויים מזוהה עם משמעות ספציפית (למשל משקל מקומות או משקל מכשירים), דובר העברית יוצר ומבין באופן אינטואטיבי מילים חדשות במשקל זה, כשהוא משלב את המשמעות של השורש עם המשמעות של המשקל. כך נולדו מונחי מחשב כמו לומדה, קוֹשְחָה, רוֹגְלָה ו-שוֹתְפָה הרשמיות, ולצידן גוֹנְבָה ודוֹפְקָה הממזריות. על הדרך אפשר לציין גם את ההברקה פורנה, אבל זה כבר שייך לחיים בכחול.

[שפרה צח היא כותבת, עורכת, ובעלת הבלוג יהדותי למשתמש.]

Read Full Post »


אם יצא לכם בזמן האחרון להיתקל בקבוצת אנשים שפולטים בזה אחר זה מילים שנראות לא קשורות אחת לשניה, תוך שהם משמיעים קריאות 'זה לא חוקי!' או 'היה כבר!', כנראה שנפלתם על משחק הסגוליים. תחביב חדש של גיקים-אוהבי-בלשנות. הכללים לכאורה פשוטים: כל אחד בתורו צריך להגיד מילה במשקל הסגוליים, שמתחילה באות בה הסתיימה המילה הקודמת, ואסור לחזור על אותה מילה פעמיים. נשמע משעמם? אני מכירה באופן אישי כאלה שמסוגלים לשחק בזה שעות.


על משקל הסגוליים אפשר לקרוא בהרחבה כאן. לענייננו חשובים רק המשקלים הסגוליים הבסיסיים – קֶטֶל (אֶבֶן, יֶלֶד), קֵטֶל (חֵפֶץ, פֵּשֶר) וקֹתֶל (כֹּתֶל, רֹטֶב). פשוט, כאילו, אבל טריקי. כי סימן הזיהוי השמיעתי של המשקל הבסיסי (שתי תנועות E רצופות או תנועת O ו-E) מקבל ואריציות שונות בגלל אותיות  גרונית באמצע המילה (סַהַר) או בסופה (סֶלַע) וכן ו' באמצע (גָּוֶן) ו-י' באמצע (בַּיִת) או בסוף (לֶחִי).
אבל יש פטנט אחד שלפיו אפשר לזהות את הממזרים (טוב, חוץ מכמה עושי צרות עם ו' ו-י'): צורת הרבים. במקום להסתפק בסיומת הריבוי המקובלת – Xים/Xוֹת, הסגוליים ברבים מאבדים את סגלוליותם ובמקום זה מתחילים בשווא וקמץ: יֶלֶד – יְלָדִים, מֶלֶךְ – מְלָכִים. זה נכון גם לגבי סגוליים עם אות גרונית באמצע או בסוף, כמו שַעַר-שְעָרִים או סֶלַע-סְלָעִים. רק כאשר האות הגרונית היא בתחילת המילה, יוחלף השווא בתנועת חטף – חטף-פתח למשקל קֶטֶל/קֵטֶל (עֵדֶר-עֲדָרִים) או חטף-קמץ למשקל קֹטֶל (עֹדֶף-עֳדָפִים).


והנה מצאתי שלוש מילים שלא מצייתות לכלל הזה, כולן במשקל קֹטֶל: קֹדֶש-קָדָשִים; שֹרֶש-שָרָשִים (האות הראשונה מנוקדת בקמץ קטן ונהגית כ-O), וגם בֹּטֶן-בֹּטְנִים. למה הן לא מתנהגות כמו כולן?
לגבי קֹדֶש ושֹרֶש, נראה לי שהפתרון נעוץ בצורה המוזיקלית-חגיגית של הצרוף המקראי קֹדֶש-קֳדָשִים, שיצר פורמט שלתוכו נוצקו כל המילים הדומות, ובהן גם שורש. (מה גם שחלק מהן ממילא מתחילות באות גרונית, כמו  חֹדֶש ועֹנֶש).
אבל איך הגיעה צורת הריבוי בָּטְנִים למילה בֹּטֶן? אז זהו, שמה שבעצם קרה הוא תהליך של גזירה לאחור. המילה מופיעה בתנ"ך ברבים בלבד, בדברי יעקב לבניו: "קְחוּ מִזִּמְרַת הָאָרֶץ בִּכְלֵיכֶם, וְהוֹרִידוּ לָאִישׁ מִנְחָה: מְעַט צֳרִי וּמְעַט דְּבַשׁ, נְכֹאת וָלֹט, בָּטְנִים וּשְׁקֵדִים" (בראשית מג יא). למעשה, מה שאנחנו קוראים לו היום בטנים הוא בעצם אגוזי אדמה, ואילו המילה המקורית שימשה לתיאור פיסטוקים, הפרי של אלת-הבָּטנה. הבָּטנה נותנת בָּטנים, שבטעות הפכו בצורת היחיד לבֹּטֶן. (תהליך דומה קרה למילה נִצָּן, שהיא גזירה לאחור של נִצָּנִים – במקור הריבוי של נִצָּה).


זהו, אפשר להתחיל במשחק. ואל תגידו שלא הזהרתי אתכם.

[שפרה צח היא כותבת, עורכת, ובעלת הבלוג יהדותי למשתמש. חלק ב' של הפוסט פורסם כאן]

Read Full Post »

[זהו פוסט אורח מאת איתמר שפי, שטוען שמרוב שהוא צעיר אין לו איך למלא ביו של שורה.]

כמו כל אירוע משמעותי שמתרחש במדינתנו, גם הבחירות הקרבות עוררו את ההומור הישראלי. נכון, רוב הפוסטים בפייסבוק שקשורים לבחירות היו פוליטיים-מעצבנים-גוררי חסימה, אבל פה ושם גם ראינו גם סאטירה כמו פי 1000 יותר עוצמה לישראל, ובחמישי האחרון (למה הם חיכו כל כך הרבה?) עלה גם עמוד בשם דנד"ש שעדיין לא החלטתי אם הוא סאטירה ימנית או סתם הומור חביב. יכול להיות שאני פשוט לא מספיק מתוחכם בשביל זה.

שם העמוד קורץ לשמה של רשימת חד"ש (לפי מילון הסלנג המקיף של רוביק רוזנטל, שתי המילים נרדפות), ראשי תיבות של "דעתנים נאו-קומוניסטים דמוקרטיים שוויוניים". הפוסטים שם נחמדים, אבל הדבר שבאמת נהניתי ממנו הוא השימוש בערבית ברחבי העמוד.

נתחיל ממה שמתיימר להיות התרגום של שם המפלגה, צמד המילים שמופיע בכל הפוסטים תחת המילה דנד"ש – פטירה אלג'בן, שתרגומו הוא בכלל "עוגת גבינה". אחד מהגולשים דוברי הערבית גם הגיב (בתרגום חופשי) – "עוגת גבינה? איך לך משהו טבעוני?". תמיד חשבתי שטבעונות ושמאל רדיקלי הולכים יחד, אבל אולי זה רק אני.

דנדש

ממש ליד שם המפלגה מופיע הפתק שלה – בעברית, הניקוד חטף-פתח ('כמו שהממשל הציוני חטף את הפת"ח משלטון בעזה', אם להוציא את אחד הפוסטים בעמוד מהקשרו), ובערבית – פתחה, תנועה קצרה שמקבילה לפתח בעברית (יסלח לי יובל אם אני טועה), יחד עם שדה – שהיא דגש חזק, שממש לא הייתי מקביל לחטף בעברית.

יותר קליט מתמנון ענק

יותר קליט מתמנון ענק

ואחרון, מה שנראה כמו סיסמת המפלגה בערבית, אלחמצ – לוחה. אח'ד'

על החלק הזה שברתי את הראש. הפירוש של לוחה הוא לוח, board או plate באנגלית, והמשמעויות הכי נפוצות של הפועל אח'ד' הן לקח את- או נקט (החלטה),שני פעלים שמצריכים מושא בערבית. כנ"ל לגבי כל השימושים האחרים של הפועל שמצאתי, כולל הארכאיים שבהם. הרמז הגיע דווקא מהמילה הראשונה, אלחמצ – חומוס.

מקימי העמוד השתמשו בגוגל טרנסלייט כנראה, וכשplate זה גם "צלחת" בעברית, ממשהו כמו "קח צלחת חומוס" יצא "חומוס – לוח. קח".

99% יותר שמאל לישראל

99% יותר שמאל לישראל

חג דמוקרטיה שמח.

 [היה זה פוסט אורח מאת איתמר שפי. רוצים לפרסם פוסט אורח? יופי. תכתבו משהו ותשלחו לנו.]

Read Full Post »

[לפניכם פוסט אורח מאת עפרה הוד, מתרגמת טכנית מאנגלית לעברית.]

בואנה, שלחתי לך מֶל. אתה חייב לבוא, יש פה סֵל מטורף. גם מֵטַל מגיעה ומביאה פַּשְטֵדָה עם זֵתִים ובֵּצָה. קבענו בתֵשַע. תבוא, יהיה לֵצַן.

הציטוט הזה פותח פוסט בפייסבוק שהגיע לידיעתי כשכמה מחבריי הטובים ביותר תחבבו אותו, בעוונותיהם. מצטערת, חבר'ה, לחרב לכם את המסיבה, אבל אחרי שתקראו את הפוסט הזה לא תוכלו להתנשא יותר בכיף על מי שמשמיט את היו"ד כשהוא הוגה צירה מלא (אבל לא נורא: תמיד יישאר לנו הֶפְעִיל).

אז זהו, שפעם למדתי שבהגייה נכונה של צירה מלא לא אמורים לשמוע את היו"ד. אלף פעמים שאלנו את המורה, והיא התעקשה: אפילו ב'מדי פעם' לא אמורים לשמוע את היו"ד. ככה זה בהגייה הספרדית, וזה התקן. חזרתי לרשימותיי ומצאתי עוד משפט מעניין מאותו שיעור:

בגלל מסורת ההגייה האשכנזית (סֵייפר, בסֵיידר, חבֵיירים) מקובל להגות את היו"ד בצירה מלא. וגם ב: תֵּה, הֵ"א.

אז חוץ ממֵייל וסֵייל, שהם מסיפור אחר, מסתבר שזה דווקא בסדר גמור להגות זֵתִים ובֵּצָה. תֵשַע ולֵצַן זה לגמרי בסדר – כאן הצירה בכלל חסר. ועל הרקע הזה, אתם מוזמנים לקרוא את ההמשך הזחוח של הפוסט בפייסבוק:

שנים שאנחנו חוזרים על משפטים מסוג זה ומצחיקים בעיקר את עצמנו. עד שנתקלנו בסרטון הבא. עכשיו אנחנו רגועים, כבר חשבנו שנותרנו נטולי קולגות באחת המערכות המשעשעות ביותר: מילים שדובריהן משמיטים מהן את הי' על דעת עצמם. 17 (!) שנים אנחנו מעדכנים את הרשימה המכובדת שלנו, תארו לכם איזו הקלה לגלות שאנחנו לא לבד. פרצי עונג וצחוק ליוו אותנו בזמן שצפינו בסרט המושקע של שני חבר'ה טובים…

זה הסרטון שמדברים עליו, ואין מה להגיד, הוא מצחיק. אי אפשר לקחת ממנו את זה. ומגיעות לו גם שתי נקודות על התקציר, המדבר גלויות על היסוד העדתי שבבסיס כל הדחקה הזאת:

עידו חוסך בזמן על ידי השמטת האות יוד ממילים שכנראה היא לא נחוצה בהן, על הדרך המילים מקבלות סאונד מזרחי.

נחזור לפוסט בפייסבוק. הוא, בניגוד לסרטון, לא הכי מצחיק, והכֵּנות – ממנו והלאה. אף אחד הרי לא מאמין באמת לקומנט הבא, הממחזר בלי בושה את תירוץ בדיקת הערנות הישן והטוב:

מצאנו אמצעי מעולה לניטור המלייקקים – בטקסט לעיל יש טעות מכוונת. מי שישים לב, באמת צפה :-)

ישויות עסקיות מתחום הלשון, כמו מפרסמי הפוסט הזה, חייבות להיזהר. גם מי שאינו מומחה למדיה חברתית יודע שלא כל מה שטוב לילד בן שש עשרה מתאים גם לעסק. לא מספיק לכתוב ב-About "אוהבת מילים ואנשים". רצוי גם לגבות את זה בידע אמיתי על מילים ובסובלנות לאנשים.

[היה זה פוסט אורח מאת עפרה הוד. כותרתו מתייחסת לפוסט העבר הזה. רוצים גם אתם לפרסם פוסט אורח? אין פשוט מכך. רק תבקשו. כאילו, ותכתבו משהו.]

Read Full Post »

[פוסט אורח מאת יובל נוב]

במאמר "עלייתו ונפילתו של בניין התפעל" שהתפרסם במוסף "תרבות וספרות" של "הארץ", 23.3.2012, מביא יאיר אור דוגמאות מראשית ימי העיתונות העברית לפעלים בבניין התפעל שאינם מקובלים כיום ("התגהץ", "מתרטב" ואחרים).  הטענה המרכזית של המאמר משתקפת בכותרתו, וביתר הרחבה במשפט: "בשנים של התבססות העברית החדשה היה בניין התפעל נפוץ ביותר, הרבה יותר מכפי שהנו כיום".  טענה מעניינת, אולם, אפעס, לא מגובה בשום נתונים מספריים.  אינני בלשן או חוקר תקשורת, אך כספקן מדופלם וחובב לשון, החלטתי להפשיל שרוולים ולבדוק האם יש בטענה ממש.

שני הציטוטים הראשונים מכתבתו של אור לקוחים מכתבות בעיתונים "דבר" ו"דואר היום", מהשנים 1936 ו-1921, בהתאמה.  באדיבות jpress.org.il המופלא, איתרתי את גיליון "דבר" המתאים לציטוט הראשון; היות שאור לא פירט את היום המדויק בו התפרסם הציטוט השני, בחרתי בגיליון הראשון של "דואר היום" משנת 1921.  מכל אחד משני הגיליונות בחרתי שתי כתבות: הכתבה המרכזית בעמוד הראשון, והכתבה המרכזית בעמוד האחרון (את אחת הכתבות מ"דואר היום" מסתבר שחיבר אחד, א. בן יהודה).

בנוסף, בחרתי בכתבה המרכזית בעמוד הראשון ובכתבה המרכזית בעמוד האחרון (של קונטרס החדשות) משני עיתונים בני-זמננו: "הארץ" ו"ידיעות אחרונות", מהתאריך 28.3.2012.  בכל אחת משמונה הכתבות, ספרתי את מספר המופעים של פעלים, שמות פעולה ושמות פועל בבניין התפעל, ואת מספר המופעים של אלה מששת הבניינים האחרים.

ומה היו התוצאות?  אחוז המילים שמקורן בבניין התפעל מכלל הפעלים ושמות הפעולה בכתבות מתקופת היישוב היה 7.16, ואילו האחוז המקביל בכתבות בנות זמננו היה 6.73.  זהו הבדל זעיר שאינו מובהק סטטיסטית (p = 0.97), ובוודאי שאינו מלמד כי בניין התפעל היה נפוץ יותר בעבר "הרבה יותר מכפי שהנו כיום".

הבדיקה שערכתי היתה מרושלת למדי והתבססה על מדגם קטן מאד, כך שלא הייתי ממהר להסיק ממנה מסקנות גורפות כלשהן.  בהחלט ייתכן כי אור טרח יותר ממני, השווה בקפדנות בין קורפוסים רחבים יותר של כתבים משתי התקופות וקיבל תימוכין לטענתו, אולם בכתבתו שהתפרסמה ב"הארץ" לא מוזכרת בדיקה שכזו.

לדעתי הלא מלומדת, התופעה הכללית שעליה מצביע אור – מילים שהיו נפוצות בעבר והפכו לנדירות כיום – אינה אופיינית במיוחד לבניין התפעל.  השעה המרתקת שביליתי בקריאת עיתונים מראשית המאה שעברה סיפקה לי שפע דוגמאות של מילים שאינן קשורות לבניין התפעל, ושצללו לתהום הנשייה.  גם בציטוטים של אור עצמו מופיעות מילים שכאלה, שהחביבה עלי מביניהן היא "חינה", בביטוי "חינה מזדיינת" ("סין מתחמשת", בשפת ימינו).

[יובל נוב הוא מרצה בחוג לסטטיסטיקה באוניברסיטת חיפה, עורך באתר "האייל הקורא", וחובב לשון.]

Read Full Post »

מתן מזור שלח לדסק חגי ישראל של דגש קל (באמת? אנחנו עדיין עושים את הבדיחה הזו עם הדסקים?) את החנוכיה התחבירית החביבה הזו, ואנו שמחים לשתף אותה עם קוראינו. חג שמח!

זה גם עץ חתרני. לבנות עצים כלפי מטה זה ביג נו-נו, לפחות בחוג בת"א.

Read Full Post »

דסק האוונגארד של הבלוג שמח להציג קומיקס אורח פרי עטו ודף השורות של מתי ברסקי, מסטרנט להיסטוריה ופילוסופיה של המדעים באוניברסיטת תל-אביב. כפי שאולי הרגשתם, הקיץ נותן אותותיו בכותביו הקבועים של הבלוג שעסוקים מאוד מי במבחניו, מי בתזתו, מי בעבודתו ומי במאמריו. תודה למתי על השינוי המרענן – לִחצו להגדלה.

Read Full Post »

[פוסט אורח של דפנה שיזף, בלשנית חישובית וספקנית]

התגובה הראשונה שלי כשראיתי שהספר "בראי השפה" של גיא דויטשר יצא בעברית היתה: שיט, סתם קראתי אותו באנגלית. התגובה הבוגרת ביותר, שבאה אחר כך, היתה שמחה על התרומה המבורכת למדף הבלשנות הפופולרית (והמדע הפופולרי בכלל) בעברית.

קודם כל, למי שטרם הספיק, רוצו לקרוא את הספר הקודם שלו, "גלגולי לשון". אחרי זה השאילו אותו לכמה שיותר אנשים. "גלגולי לשון", שעוסק בשינוי והתפתחות של שפות, הוא ניידת חילוץ והצלה מבורוּת בלשנית וטהרנות-רחוב.

"בראי השפה" מתעמת עם שאלה בלשנית נוספת שצצה הרבה בזירה הפופולרית, ובדרך כלל מתוך בורות בטוחה בעצמה: הקשר בין תרבות, שפה וחשיבה. הדבר הראשון שדויטשר עושה הוא לפרק את הנושא לשניים: המראָה והעדשה. החלק הראשון של הספר עוסק בשפה כמראה– האם שפות משקפות את החברות שמדברות אותן? חלקו השני דן בשאלת השפה כעדשה – האם שפות משפיעות על הדרך שבה דובריהן רואים את המציאות? הפרדה חשובה ולא טריוויאלית – אנשים נוטים לחשוב שאם לאסקימוסים יש הרבה מילים לשלג (שאלת "מראתית" שנויה במחלוקת) אז בהכרח אסקימוסים יודעים להבחין יותר טוב מאחרים בין סוגים שונים של שלג (שאלת "עדשתית" נפרדת).

בעניין המראה

אבל מספר המילים לשלג הוא טריוויה לשונית. סביר שאוצר המילים של שפה יושפע מהסביבה הפיזית והטכנולוגית של דובריה (ולכן דוברי עברית מודרנית לא זקוקים להבחנה בין "גדיד" ל"בציר"). החלק הראשון של "בראי השפה" לוקח את שאלת המראָה צעד אחד קדימה. נושא דיון ארבעה מחמשת פרקיו הוא: למה הומרוס דימה את צבע הים לצבע של יין? או באופן יותר כללי: האם בשפות שונות יש מספר שונה של מילים לצבעים, והאם זה קשור לרמת ההתפתחות האירגונית-טכנולוגית של החברה?

בקריאת ארבעת הפרקים האלה מתגלה סוד קטן על הספר: זה בעצם ספר על היסטוריה אינטלקטואלית, היסטוריה וסוציולוגיה של מדע הבלשנות לא פחות מאשר ספר על בלשנות. את התשובה לשאלת המילים לצבעים תוכלו, לכשתקראו, לנסח בפסקה. שאר 74 העמודים (במהדורה האנגלית) מגוללים 150 שנה של דיון מדעי רב תהפוכות בשאלה הזאת. זה סיפור מרתק, ודויטשר יודע לבנות דמויות, לשמור על מתח ולתבל בהומור. אנחנו לומדים לא מעט על העשייה המדעית ועל טיבו של ידע, אבל קצת פחות על בלשנות.

הפרק החמישי הוא מסע צלב נגד הטענה שמבחינה דקדוקית "כל השפות מורכבות באותה מידה". דויטשר מראה שזאת טענה דוגמטית חסרת בסיס אמפירי. הביקורת של דויטשר כל כך חריפה, שאפשר לדמיין אותו מתקתק את הפרק הזה בחמת זעם שמאיימת לשבור את המקלדת (וזאת עדות לכישרון הכתיבה שלו). אבל חמת הזעם הזאת נראית לי קצת פונה פנימה, לקהילת הבלשנים. לא ברור לי עד כמה שכיחות מבנה שיעבוד בשפות עתיקות (לדוגמה) היא שאלה מרתקת עבור הקהל הרחב.

בעניין העדשה

ובשלב זה אנחנו מגיעים לשאלה הטעונה יותר: שאלת העדשה. בחלק השני של הספר דויטשר מתאר את המסלול שעברה הטענה שהשפה משפיעה על החשיבה שלנו, מוורפיזם, לאנטי-וורפיזם לנאו-וורפיזם.

וורפיזם, על-שם בנג'מין לי וורף והשערת ספיר-וורף, הוא הטענה שהשפה שאנחנו מדברים מגבילה את הדרך שבה אנחנו תופסים, מבינים או חושבים. הטענה זכתה לפופולריות מסוימת בחצי הראשון של המאה ה-20, אבל עם הזמן התברר שאין לה שום בסיס ראייתי ושהיא די מנוגדת לעובדות ולהיגיון, והיא הפכה לסוג של אמונה תפלה שחוגים בלשניים מזלזלים בה.

בשנים האחרונות התחילו לצוץ עבודות שזוכות לכותרת "נאו-וורפיזם". הנאו-וורפיזם, מבחין דויטשר, שונה מהוורפיזם לפחות בשתי דרכים. הוא מבוסס על ראיות ולא על השערות פרועות (שזה לא רע עבור משהו שרוצה להיות מדע). חוץ מזה, הנאו-וורפיזם לא תופס את השפה כבית-כלא שמגביל את החשיבה שלנו, אלא כמאמנת שמרגילה אותנו לחשוב בדרכים מסוימות. דוברי שפות שיש בהן יותר הבחנות כרומטיות לא רואים יותר צבעים מדוברי שפות עניות-בגוונים, אבל מסתמן שהם מסוגלים להבחין בין גוונים יותר מהר. דוברי ספרדית וגרמנית מבינים היטב שהמין הדקדוקי של המילה "גשר" בלשונותיהם הוא שרירותי, אבל דוברי ספרדית נוטים לחשוב שגשרים (זכרים) הם חזקים, ודוברי גרמנית חושבים שגשרים (נקבות) הם אלגנטיים. ויש כמה מחקרים עם ממצאים שישאירו אתכם פעורי פה, על שפות שאין להן "ימין" ו"שמאל", רק "צפון" ו"דרום" ו"מזרח" ו"מערב" – ואני בכוונה נמנעת מלספיילר לכם את הנושא הזה.

בינתיים, בעוד שהגלגל המדעי מסתובב והידע נצבר, בציבור הרחב ממשיך לשרור וורפיזם נאיבי, בסגנון האקסימוסים והשלג. הפרק שבו דויטשר מפרק לוורפיזם המקורי את הצורה, ואז מניח מחדש את היסודות לנאו-וורפיזם הוא נפלא. ברצינות. צריך להקים תנועת גרילה שתצלם עותקים שלו ותתלה על עצים ולוחות מודעות.

הבעיה היא שכמות הממצאים לנאו-וורפיזם עדיין דלה. שלושת התחומים שבהם הספר מביא (צבעים, מינים וכיוונים) הם שלוש הדוגמאות הקלאסיות שמוזכרות בכל פעם שהנושא עולה. מתוכן, רק דוגמת הכיוונים היא מסעירה באמת (בעיני). בשתי הדוגמאות האחרות, ההשפעה של השפה על התפיסה על קטנה, כמעט נקודתית, ונדרשים כלים מחקריים די כבדים כדי לגלות אותה. זה קצת הר שהוליד עכבר.

אני מלאת כבוד והערכה לכל מי שמנסה להביא מדע לציבור הרחב. אני מעריצה את גיא דויטשר כי הוא עושה את זה בכישרון ובהצלחה. אבל נראה לי שהנושא שבחר הפעם צעיר מדי (בגלגולו המדעי הנוכחי) ולא מבוסס מספיק כדי להצדיק ספר שלם. התוצאה היא העיסוק הרב בהיסטוריה, סוציולוגיה ומתודולוגיה, בהעדר כמות מספיקה של ממצאים בלשניים ממשיים. מבחינה זו הקריאה איכזבה אותי. אבל זה עדיין ספר מרתק ומומלץ. אולי הבעיה שלי היתה יותר בעיה של תיאום ציפיות; מי שייקרא את הספר אחרי שקרא את הביקורת הזאת והבין מי נגד מי, יידע למה לצפות ויהנה הנאה שלמה.

[עדכון 24/6 – דויטשר מצטרף לדיון בתגובות.]

גיא דויטשר (2011). בראי השפה. מאנגלית: עמרי אשר. הוצאת חרגול, 311 עמ'.

Read Full Post »

[פוסט אורח מאת שאולי לב]

במסגרת מחקר שאני משתתף בו כעוזר, עלי לנתח מדגם של פסוקים מהתנ"ך. לאחרונה נתקלתי בקטע הבא ממשלי, פרק כג, לא –לג:

אַל תֵּרֶא יַיִן כִּי יִתְאַדָּם כִּי יִתֵּן בַּכּוֹס עֵינוֹ יִתְהַלֵּךְ בְּמֵישָׁרִים: אַחֲרִיתוֹ כְּנָחָשׁ יִשָּׁךְ וּכְצִפְעֹנִי יַפְרִשׁ: עֵינֶיךָ יִרְאוּ זָרוֹת וְלִבְּךָ יְדַבֵּר תַּהְפֻּכוֹת:

הפסוקים מוכרים לנו מהביטוי "נתן עינו בכוס", שמשמעותו "שתה אלכוהול, השתכר". כלומר, הביטוי משלב בתוכו שתי מטונימיות:  העין מייצגת את האדם השותה, והכוס מייצגת את המשקה האלכוהולי. הביטוי נקרע מתוך פסוק ל"א, כחלק מדבר תוכחה כנגד שתיית אלכוהול. הצירוף "יתהלך במישרים" מפורש בתלמוד כך: "כל הנותן עינו בכוסו עריות כולן דומות עליו כמישור" (ת"ב יומא עד ב'). רש"י מפרש כך: "המרבה שכרות כל עבירות דומות לו למישור כל הדרכים ישרים בעיניו". לפי פירושים אלה, משמעות הפסוק במילותינו שלנו היא בערך כך: "אל תתפתה ליין האדום, כי מי שנוהג להשתכר, מפסיק להבחין בין טוב לרע".

עיון דקדקני בקטע, מגלה כי לפנינו ביטוי שנטבע, בשל טעות בהבנת התחביר והלקסיקון המקראיים, במשמעות שונה מזו המקורית. רגישות תחבירית לרצף הפסוקים תגלה, כי הדובר משתמש בגוף שני כאשר הוא פונה אל הנמען: אל-תרא, עיניך יראו זרות, לבך ידבר תהפוכות. על היין הוא מדבר בגוף שלישי: כי יתאדם. אם מבינים את המשפט "כי יתן בכוס עינו, יתהלך במישרים" במובנו היום, כמשפט תוכחה המנוסח בכוונה בגוף שלישי, עולה השאלה, מדוע התחביר לא עקבי? מדוע הדובר חוזר לדבר בגוף שני כאשר הוא מאיים על הנמען "עיניך יראו זרות וליבך ידבר תהפוכות"? מנקודת מבט של דוברי עברית מודרנית, אנחנו נוהגים "לעשות הנחות דקדוקיות" למספר המקראי, ומקבלים בהבנה ניסוחים תחביריים קשים. פעמים רבות, יש סיבות טובות לעשות זאת, אבל במקרה הזה נראה שמקור הטעות היא דווקא התעלמות ממשמעות של המילה "עין", שהיתה יחסית נגישה בתקופת המקרא, ומאז, כנראה, פחות. יש להבין כאן את "עין" לא כאבר הראייה, אלא במשמעות "מראה", כמו בדוגמאות בקישור הזה. בעברית של ימינו נותר זכר למשמעות זו בביטויים "כעין" ו"מעין", שמשמעותם "כמו". סביב הפירוש של המילה "עין" כאבר הראייה, נוצרה משמעות הביטוי כולו כפי שהוא מוכר לנו היום. אם חוזרים לפרש את המילה "עין" כ"מראה", מגלים שהתחביר המקראי עקבי ומסודר במקרה הזה: כל מה שמנוסח בגוף שלישי, מתייחס אל היין, ולא אל אדם ששותה. כלומר, מה ש"נותן עינו בכוס" הוא היין, ולא השתיין. היין נותן את מראהו, את צבעו, לכוס, כאשר הוא נמזג לתוכה. היין הוא הנחש והצפעוני, והיין הוא זה ש"מתהלך במישרים".

חיזוק לכך שייתכן והכוונה המקורית של הפסוק היא אחרת, קיבלתי מתרגום התנ"ך לאנגלית של מכון ממרא. הפסוק מתורגם כך:

Look not thou upon the wine when it is red, when it giveth its colour in the cup, when it glideth down smoothly: At the last it biteth like a serpent, and stingeth like a basilisk: Thine eyes shall behold strange things, and thy heart shall utter confused things:

גם התרגום הלטיני, הvulgata, מתרגם את הפסוק במובנו המילולי, ולא המטאפורי:

Ne intuearis vinum quando flavescit, cum splenduerit in vitro color ejus; ingreditur blande:

אבל נותר עוד קושי. מה פירוש "מתהלך במישרים"? האם אפשר להבינו כפי שהבינו המתרגם לאנגלית?

כאן נחלצים לעזרתי שניים מגיבורי התרבות של ימינו: מאיר אריאל, וקוזמו קריימר. מאיר אריאל הלחין את עשרת הפסוקים הראשונים של פרק ז' בשיר השירים, וביצע אותו באלבום "ירוקות" תחת השם "שיר גנוב". אלמלא הוא, לא הייתי מכיר את פסוק י':

וְחִכֵּךְ כְּיֵין הַטּוֹב הוֹלֵךְ לְדוֹדִי לְמֵישָׁרִים דּוֹבֵב שִׂפְתֵי יְשֵׁנִים.

כלומר, זוהי הגרסה המקראית ל"יורד חלק בגרון", תכונה של משקה איכותי.

מי שזוכר את קריימר עושה פרסומת לויסקי "הניגנס" נזכר ש"הולך" מתורגם ל "go", מה שאולי עזר למתרגם לאנגלית לשמור על האינטואיציה שקושרת את "יתהלך" ליין. גם אם לא, תמיד מצחיק.

זהו, אם כן. פיצוח: הפסוק הראשון מתייחס כולו לתכונותיו המפתות של היין; האודם, המראה העז הנשקף מן הכוס, הנוזל המגרה והנעים ללגימה. רק בפסוק הבא מתחיל תאור תכונותיו הערמומיות והשליליות של האלכוהול. תודו שלא חשבתם..

בעברית ישנם עוד כמה ביטויים שעברו תהליך דומה של שינוי משמעות, שנובעת מהבנה שונה של המקור המקראי, למשל:

"קול קורא במדבר" (ישעיהו מ' ג') במקור: קוֹל קוֹרֵא: בַּמִּדְבָּר פַּנּוּ דֶּרֶךְ ה' יַשְּׁרוּ בָּעֲרָבָה מְסִלָּה לֵאלֹהֵינוּ, ולא במשמעות של ימינו, הכרזה נרגשת שלא מקשיבים לה.

"קול ברמה נשמע" (ירמיהו ל"א י"ד) כשהפסוק מתייחס לעיר "רמה" ולא לעוצמת הקול.

"אדם לעמל יולד": איוב ה' 7: כִּי לֹא יֵצֵא מֵעָפָר אָוֶן וּמֵאֲדָמָה לֹא יִצְמַח עָמָל: כִּי אָדָם לְעָמָל יוּלָּד וּבְנֵי רֶשֶׁף יַגְבִּיהוּ עוּף: עמל כאן במשמעות של "סבל", ולא במשמעות הקיבוצניקית ששגורה בימינו.

דוגמה מרתקת נוספת היא גלגולו של הביטוי "כי האדם עץ השדה", במקור מספר דברים, פרק כ', י"ט: כִּי תָצוּר אֶל עִיר יָמִים רַבִּים לְהִלָּחֵם עָלֶיהָ לְתָפְשָׂהּ לֹא תַשְׁחִית אֶת עֵצָהּ לִנְדֹּחַ עָלָיו גַּרְזֶן כִּי מִמֶּנּוּ תֹאכֵל וְאֹתוֹ לֹא תִכְרֹת כִּי הָאָדָם עֵץ הַשָּׂדֶה לָבֹא מִפָּנֶיךָ בַּמָּצוֹר:

הביטוי מובן לנו כממשיל את עץ השדה לאדם (או להפך), ומעניק לו תכונות אנושיות, שעל כן אין להתאכזר לעצים בזמן מלחמה. אולם יש להבין את חלקו האחרון של הפסוק כשאלה רטורית: "כי האדם עץ השדה, לבוא מפניך במצור?" האם העץ הוא אדם, שיכול להתמודד איתך ולהלחם בך? מה שמקשה על הבנה אינטואיטיבית הוא החלפת סדר המרכיבים במשפט. הנושא התחבירי הוא עץ השדה, והאדם הוא הנשוא, ולא להפך. הפסוק מדגיש דווקא את השוני, ולא את המשותף, בין העץ לאדם, כמקור הציווי לא לפגוע בעץ השדה ("תג מחיר", מישהו?).

אז למה זה מעניין? כי הביטויים והפתגמים האלה מלמדים עד כמה השפה נתונה, כתכונה מהותית ולא כתוצר לוואי מקרי, לאי הבנה ולשינויי משמעות, ולא רק ממרחק אלפיים חמש-מאות שנה של ימינו, אלא כבר מתקופות קדומות יותר, קרובות יותר למקור. השימוש שהדוברים עושים בלקסיקון הקיים של השפה הוא לצרכיהם שלהם, ולא תמיד הם מחוייבים להתייחס למקור ולהיות נאמנים לו, במיחד כאשר השימוש החדש קורה במנותק מההקשר המקורי שבו נאמרו הדברים. לפעמים, התוצאה של שימוש שכזה היא שינוי מוחלט במשמעות.

[שאולי לב הוא סטודנט לתואר שני בבלשנות באוניברסיטת ת"א, וחבר עמותת הפועל אוסישקין תל-אביב. רוצים גם אתם לפרסם פוסט אורח? נשמח, אנחנו בתקופת מבחנים.]

Read Full Post »

[פוסט אורח מאת אמיר אהרוני, כותב הבלוג "חיפושים כמשל"]

ביום שלישי הייתי בכנס "החינוך ביד הלשון: בין המחקר הלשוני לעשייה החינוכית" באוניברסיטת חיפה. חינוך לשוני זה הדבר שהכי מעניין אותי בבלשנות ובחיים בכלל, כך שכותרת הכנס כבר הייתה מספיקה כדי לגרום לי לרצות להגיע. עבור הרבה אנשים אחרים הסיבה להגיע היא הרצאת מליאה של גיא דויטשר, בלשן ישראלי שעובד בעיקר באוניברסיטת מנצ׳סטר, ושהתפרסם בזכות ספרו "גלגולי לשון". אבל מכיוון שאני עוף מוזר ואיכשהו טרם התגלגלתי לקרוא את הספר הזה, לא גיא דויטשר היה המגנט ששכנע אותי סופית לנסוע שעתיים לחיפה, כי אם רחל רוזנר.

מיהי רחל רוזנר? לפני מספר חודשים התחלתי לכתוב איזה מאמר שעוסק בניקוד (פרטים בקרוב) ורציתי להוסיף אליו פרק על הוראת הניקוד בבתי ספר. התקשרתי למשרד החינוך ושם הפנו אותי לרחל רוזנר, שכתבה את עבודת הדוקטורט שלה על ההיסטוריה של החינוך הלשוני בארץ. אז ניצלתי את ההזדמנות לבוא להכיר מישהי שאכפת לה מחינוך לשוני עד כדי כך שהיא כתבה על זה דוקטורט. ההרצאה שלה בכנס עסקה גם היא בהיסטוריה של החינוך הלשוני בארץ ועל ההשפעות של האפנות בבלשנות האקדמית על תכנית הלימודים הממלכתית. מאמר שמבוסס על אותה ההרצאה אמור להתפרסם בקרוב ואני מצפה לו בקוצר רוח.

אבל אל תחשבו, חלילה, שאני מזלזל בגיא דויטשר. לא הכרתי אותו עד עכשיו, אבל ההרצאה שלו הייתה אחת הטובות ששמעתי אי־פעם. היא לא חידשה לי הרבה; עבורי, הערך שלה מצוי בעיקר בזה שדויטשר הראה שאפשר להיות בלשן צעיר וכוכב ומרצה מבוקש בלי לשבור מוסכמות ולעצבן את הקהל באמירות מתריסות ובלי להיות מתנגד קיצוני לדקדוק פוסקני; לא להכעיס, אלא לפייס. הרצאתו עסקה בתסכול שחווים הילדים בשיעורי לשון כאשר מורים מתייגים משפטים שהם אומרים כ"שגיאות", אף־על־פי שלאותם הילדים המשפטים האלה נשמעים הגיוניים: "למה 'למרות ש־' אסור ו'מפני ש־' מותר? למה 'הואיל ו־' מותר ו'במידה ו־' אסור?".

לטעמי "הואיל ו־" לא הרבה יותר טוב מ"במידה ו־", כי שניהם משמשים לזיון שכל משפטי. מתקני לשון אומרים ש"הואיל ו־" תקין – אבל למה הם אומרים את זה? כי הם מצאו אותו במקורות העתיקים והמכובדים ואת "במידה ו־" הם לא מצאו שם. בשלב הזה בלשנים רבים היו פוסקים שאותם מתקני הלשון פשוט צריכים לסתום, כי כל מה שהם אומרים זה קשקוש מוחלט שאין לו שום קשר לבלשנות. דויטשר מסכים עם זה שתיקון "שגיאות" לשון והוראת לשון תקנית אינם קשורים לבלשנות מדעית, אבל טוען שזה לא הופך אותם לדברים אסורים באופן מוחלט. אלה דברים הגיוניים וצפויים, וכשהם נעשים בחכמה, הם אפילו רצויים מבחינה חברתית.

איך עושים אותם בחכמה? משלימים עם העובדה שלשון תקנית אינה הגיונית יותר מלשון "מדוברת": ב"שגיאות" בשפה המדוברת יש לרוב היגיון, והן נחשבות לשגיאות רק בשל הזיהוי בין דיבור כזה לבין שכבות נמוכות בחברה, ולהפך – הלשון התקנית הספרותית הגבוהה כוללת כל מיני סתירות והפתעות, שממשיכות להתקיים ולהיחשב "נכונות" רק בשל היוקרה שיש לספרים שבה הם כתובים. אם משלימים עם זה ומסבירים את האמת הפשוטה הזאת לתלמידים, זה חוסך להם את התסכול ועוזר להם להפיק מלימודי לשון תועלת. דויטשר גם סיפר שלפני מספר שנים בלשן אחד עשה תגלית מרעישה: שהלשון העברית שמדברים היום בישראל אינה אותה לשון שדיברו בה דויד המלך ורבי עקיבא, ולכן לא צריך ללמד את הלשון של דויד המלך בבתי הספר. דויטשר טען שהצגת הדברים בצורה כזאת מעידה על חוסר ההבנה המוחלט של אותו הבלשן במהות הבעיה: אם מודים שלשונו של דויד המלך אינה בדיוק הלשון שבה מדברים התלמידים, או אז דווקא כן אפשר ללמד אותה בתור לשון התרבות, משום שיש ביקוש לדבר הזה שנקרא "לשון תרבות". המורים פשוט צריכים להפסיק לשקר לעצמם ולתלמידים, ויהיה להם סיכוי להשיג את מה שהם רוצים – שהילדים יֵדעו את הלשון הספרותית הגבוהה והעתיקה. הוא לא הזכיר את שמו של אותו בלשן; נחשו לבד.

הרצאה מעניינת, אם כי לא לגמרי קשורה לחינוך לשוני, העבירה יהודית הנשקה. היא עסקה בייצוג של לשון הפריפריה הישראלית בספרות עם דוגמאות מהספר – ניחשתם נכון – "שום גמדים לא יבואו" של שרה שילה. את הספר הזה כן קראתי, כי היה ברור שהמון בלשנים ירצו לכתוב עליו עבודות. המסר העיקרי של ההרצאה היה שהלשון של גיבורי הספר היא לא סתם עברית "נמוכה", אלא שמיוצגים בה בחכמה יסודות של ערבית יהודית מרוקאית, למשל "עזבתי" = "השארתי", "לקום" = "להתעורר", ועוד. אומנם הייצוג הזה לא בהכרח מהימן וייתכן שהוא חוטא למציאות, אבל – וזאת כבר תוספת שלי – אם מפעילים את הדמיון, כך אולי הייתה נשמעת השפה אילו בן־יהודה לא היה פרלמן, אלא אברג׳יל, כפי שמפנטז גלעד צוקרמן (ישראלית שפה יפה, עמ׳ 49).

הרצאה נהדרת נוספת הייתה זו של מיכל אפרת, שטענה שהילדים הם בלשנים קטנים. יש בזה כנראה ההשפעה מחומסקי, שטוען שדקדוק זו יכולת מולדת; לטענה הזאת יש מתנגדים רבים, אבל קשה להטיל ספק בטענתה של אפרת כי ילד שמתחיל כיתה א׳ כבר יודע המון על הדקדוק של השפה שלו, גם אם אינו יודע להגדיר מה זה פועל ומה זה נשוא. אפרת בדקה את תכניות הלימודים בלשון ומצאה שהן מתעלמות משפה מדוברות – "לפי התכניות, בשפה המדוברת אין דקדוק וסדר, אלא רק בשפה הכתובה", ושהיעדים של הוראת לשון נשארים באופן מתמיה ביותר זהים מכיתה לכיתה ואינם מתקדמים. אהבתי את ההרצאה, כי כשאנשים שואלים אותי דברים על לשון, אני תמיד משתדל לענות להם עם כמה שפחות מונחים מדעיים ולהראות לאנשים כמה לשון הם כבר יודעים.

הרצאה חמודה העבירה רביעה בסיס: היא דיברה על ההשפעה של העברית על הערבית המדוברת בישראל. אני אוסף לאט־לאט ביטויים כאלה כאן בדף "מעריב ערבים", אבל היא הביאה דוגמאות שאהבתי הרבה יותר: "טִיבּוּל נמרץ", "בנק הבועלים" ו"חִיבּוּשׂ בגוגל". מעבר לצחוקים, זאת הייתה הרצאה נהדרת, גם אם לא מאוד מחדשת, מצד הבלשנות התיאורית, כי חוץ מביטויים משעשעים היא גם הציגה תופעות מסקרנות בתורת הצורות ובתורת ההגה של העברית המדוברת, אבל מעט התאכזבתי מהמסקנה שלה: בסיס הביעה תקווה שהשפה הערבית תזכה למעמד מכובד יותר בישראל, בהתאם להיותה שפה רשמית – ועם זה אני בהחלט מסכים – וגם הוסיפה שהאקדמיה ללשון הערבית, שהוקמה בישראל לפני מספר שנים, צריכה לדאוג לכך שהערבית תישאר טהורה יותר וגם להמציא מונחים טכנולוגיים בערבית, כדי שהערבים לא יצטרכו להגיד בעברית "מזגן".

ובכן, זה בדיוק מה שהאקדמיה ללשון הערבית אצלנו לא אמורה לעשות, כי האקדמיה ללשון הערבית בסוריה עושה את זה עבור כל מדינות ערב ולפי ששמעתי, הולך לה די טוב. האקדמיה ללשון הערבית בישראל אמורה לחקור את הלשון של הערבים בישראל, עם ההשפעות הבלתי־נמנעות מכיוון העברית, ועם ההתפתחויות הפנימיות שבה. והיא צריכה לכתוב לה ספר דקדוק שלם ומסודר ולהנהיג לה כתיב תקני. כדי שדוברי הערבית בארץ יוכלו לנשום לרווחה ולדעת שהם מדברים בשפה אמתית שגם לה יש דקדוק.

ההרצאה האחרונה הייתה הפתעה גדולה: ליאור דגן הציג שיטה חווייתית לשימוש בשפה הערבית כדי להסביר תופעות בשפה העברית. הוא סיפר סיפור פשוט לילדים, כולו בערבית, והדגים לקהל איך אפשר גם להבין את הסיפור, גם ללמוד כמה דברים על דקדוק עברי וגם ללמוד קצת על תורת ההגה השוואתית בהרבה כיף.


אסיים בדבר חשוב שנאמר באחת ההרצאות, לצערי שכחתי של מי: אחת המטרות של תכנית הלימודים בעברית היא לטפח את הרגשות כלפי הלשון, מה שלא מוגדר כמטרה של לימודי האנגלית. משיחות עם תלמידי בית ספר של היום קיבלתי את הרושם שלכולם יש רגשות חיוביים כלפי אנגלית – אולי קשה להם ללמוד אותה, אבל הם חושבים שהיא שפה יפה. כי המוזיקה, הסרטים ואתרי האינטרנט שמעניינים אותם כתובים באנגלית. לעומת זאת, העברית מבחינתם היא בררת מחדל לא מי־יודע־מה מוצלחת. אז כן – ועכשיו אני לא מדבר בתור בלשן, אלא סתם בתור אחד שמשום־מה בוחר לגור בישראל – צריך לטפח רגשות כלפי העברית. אבל לא בגלל שזאת שפת התנ״ך, אלא פשוט כי זאת השפה שלנו.

Read Full Post »

[פוסט אורח של ברק אוירבך, דוקטורנט בחוג ללשון העברית באוניברסיטת חיפה]

בפרסומת החדשה של חברת "עלית" למוצר הנצחי — ה"ופל" — מוצגת שאלה מעניינת. בפרסומת מתוארת ישיבת הנהלה בחברה, ובמהלכה מתעורר ויכוח בין מנכ"ל החברה לבין אחד הסובבים את השולחן, דמות מצוירת (ילדותית משהו), עקשנית ורווית נימוקים משכנעים. השאלה שסביבה מתנהל הדיון היא: האם הצורה הנכונה היא 'וָפְלִים' או 'בָּפְלוֹת'? הנימוק המרכזי של הדמות המצוירת היא "אומרים בָּפְלוֹת". הוא מביא דוגמות מתקופות שונות בחיים (טיול של תנועת הצופים, אימא שמתפרצת לחדר ברגע אינטימי בין המצויר לחברתו, מארב בצבא), כשבכל אחת מהסיטואציות המילה ששימשה לציון הממתק הייתה "בָּפְלוֹת".

אני לא רוצה לפתוח כאן את הדיון האידיאולוגי שעולה מן הפרסומת — האם התקינות הלשונית היא על העליונה (הטהרנות, כלומר יש לומר "וָפְלִים"), או שיש לנהוג עפ"י הקורה בפועל, בשפה הדבורה היומיומית (המתירנות, ובמקרה שלנו, יש לומר "בָּפְלוֹת"). מה שכן אנסה לעשות, הוא להסביר: איך בכלל הגענו לצורה "בָּפְלָה"? וכמובן, שאין זאת אלא על קצה המזלג בלבד.

בשפות שונות בעולם, המילה המקבילה (בין אם לממתק המדובר, חטיף דק ואפוי, ובין אם לגרסאות השונות של הוופל הבלגי) דומה מאוד לזו שחדרה לעברית. באנגלית ובאיטלקית: WAFER, בגרמנית: WAFFEL (וגם OBLATE), בהולנדית WAFEL ובפולנית כמו בהולנדית, אבל גם WAFELEK. נכון, דומה מאוד לעברית, אבל איך הגענו מכאן למילה "בָּפְלָה"?

בעברית, ההגה 'W' (שהוא הגה מקורב, כלומר בין עיצור לתנועה) הפך להגה 'V' (שהוא עיצור שפתי-שיני, היינו בעת הפקת הצליל, האוויר נחסם באמצעות מגע בין השיניים לשפתיים). משום מעתק זה, נוצר מפגש בין שני עיצורים שפתיים-שיניים (ה-'V' החדש וה-'F' הקיים), וביניהם תנועות. מבחינה פיסית, קשה (באופן יחסי) ההגייה של שני העיצורים השפתיים-שיניים הללו ברצף, ולכן לשם קלות הדיבור נעשה בידול: במקום שני עיצורים בעלי תכונות דומות (שרק הקוליות מבחינה ביניהם), הוחלף אחד העיצורים בעיצור, שהתכונות שלו דומות לעיצור המוחלף אך שונות מן העיצור שנותר: העיצור הקרוב ביותר לעיצור 'V' מבחינת הקוליות ומקום החיתוך הוא 'B', ולכן הוא בא במקומו.

הרהור קטן לגבי ה-ה"א בסופה של המילה: ניסיתי לחשוב מאיפה היא הגיעה, אבל לא לגמרי ברור לי. עם זאת, אבן-שושן (1980) מסביר את המושג "אפיפית" כך: תופין דק, כעין "ביסקויט" או "ופלה". כלומר כבר אצלו מדובר בסיומת ה"א, והוא בכלל לא מכיר בקיומו של ה"ופל". מעניין, לא?

ולקינוח, איך אפשר שלא לסיים עם בָּפְלָה, ועם קטע ממערכונם של הגששים המכונית המגויסת שנכתב ע"י נסים אלוני:

-"הגיע האוטו עם הבפלה? אז תביא בפלה"
-"אין בפלה"
-"אז תביא תפוזים עם בפלה!"
-"אבל אין בפלה!"
-"אז תביא אשכוליות עם בפלה!"
-"וולאק אין בפלה!"
-"טוב….אז תביא רק בפלה!"

עכשיו תנסו אתם להגיד את השורות האלה עם "ופל" או "ופלה"…

[היתה זו רשומת אורח של ברק אוירבך. תודה ברק! קבל מאיתנו אפיפית במתנה. רוצים לכתוב גם? צרו קשר דרך צרו קשר]
 

דוקטורנט בחוג ללשון העברית באוניברסיטת חיפה

Read Full Post »

[פוסט אורח מאת הדס יברכיהו, סטודנטית לבלשנות (מי היה מאמין?) באוניברסיטת תל אביב (מי היה מאמין?)]

באחת ההפסקות ביאט"ל 26 יצאנו מאולם בק לשאוף קצת אוויר, ונתקלנו בשני שלטים, אחד מעל השני – "ארכיב מנהל הסטודנטים" ו-"ארכיון כללי והיסטורי".

 

ארכיב קיבה

תצלום ארכיון ישן

 

ככל שהיה ידוע לנו, ל"ארכיב" ול"ארכיון" יש את אותה משמעות, אז למה החליטו בבר אילן להשתמש פעם בזו ופעם בזו? לא מדובר בטעות או מקריות כיוון שצמד השלטים חוזר בעוד מקומות ברחבי הקמפוס…

אז במסגרת "בלשנות חוקרת" חיפשתי קצת במילונים ובאינטרנט, והתוצאות רק חיזקו את מה שחשבנו – לפי אבן שושן, "מילה במילה", ויקימילון (ארכיון, ארכיב) ואתר השפה העברית, שתי המילים הן מילים נרדפות שחדרו לעברית בתקופות שונות – "ארכיון" חדרה דרך יוונית/לטינית בתקופת חז"ל, ו"ארכיב" חדרה בעת החדשה בהשפעת השפות האירופאיות. לא מצאתי דבר המראה שיש הבדל במשמעות בין השתיים. בדקתי גם בגוגל (שביאט"ל התברר שהוא כלי מחקר לכל דבר), וארכיון מחזיר כ- 385,000,000 תוצאות בעוד ארכיב מחזיר כ- 179,000 תוצאות, בעיקר אתרים של שירותי גניזה וארכיב.

אוקיי, אז שתי המילים זהות במשמעות וההבדל ביניהן הוא בזמן בו חדרו לעברית. אז למה יש שני שלטים?…

שלחתי מייל לאקדמיה ללשון העברית. ענו לי ששתי הצורות הן גלגול של המילה הלטינית archivum – "ארכיון" היא מתקופת לשון חז"ל ו"ארכיב" היא מהעת החדשה, יתכן בהשפעת הגיית המילה בלשונות אירופה (למשל בגרמנית), והוסיפו שהצורה "ארכיון" עדיפה ולמעשה אפשר לראות בה צורה עברית. אפילו קיבלתי ציטוט המשלב בין שתי הגרסאות – "אלא במה יש צורך? שישיר על גדולתה של פולין, שיחטט בארכיביונים עתיקים, בכדי להוציא משם עוד ראיה נוספת לתפארתה ורוממותה של פולין." (יוסף חיים ברנר, ספרות הפולנית בערב ימי המלחמה, עמ' 6).

התקשרתי גם לאוניברסיטת בר אילן ודיברתי עם מישהו מאותו "ארכיב". מסתבר ששני השלטים מובילים לאותו מקום – ארכיב הסטודנטים – שמרכז חומר מנהלתי של האוניברסיטה. גם מצאתי תיאור של המקום באתר של האוניברסיטה. כלומר, שם המדור – ארכיב מנהל הסטודנטים, ותפקידו – ארכיון כללי של האוניברסיטה.

והמסקנה הסופית המתבקשת – שלט אחד מורה על שם המדור, והשלט השני מסביר מהו המקום הזה. כל כך פשוט. זה מסתדר יפה עם כל תוצאות שירותי הגניזה והארכיב שמצאתי בגוגל – המילה החדשה יותר משמשת בעיקר לשמות של ארגונים שונים, בעוד הוותיקה מפרשת למה הכוונה…

 

התמונה המעפנה מהפלאפון של איתמרק

בסוף לא גנזנו את התמונה השנייה

 

[. היה זה פוסט אורח. רוצים גם אתם לפרסם פוסט אורח? דברו עמנו! נקבלכם בברכה]

Read Full Post »

[פוסט אורח מאת אדם מתן]

ויקיפדיה - לוגו

האם אפשר להגדיר את מידת הדמיון בין שפות, שלא דרך מחקר בלשני?

נחשוב לרגע על קרבה בין שפות (ותרבויות). אפשר להניח, למשל, ששפות שדובריהן שוכנים זה בקרבת זה, תהיינה קרובות יותר זו לזו מאשר שפות הנמצאות ביבשות שונות. הקשר הלשוני בין שפות שונות נחקר מזה מאות שנים; אותי עניין לחקור את הנושא מזווית אחרת, של קיום מונחים זהים בשתי השפות.

נגדיר את המרחק בין שפות כסבירות לכך שמונח שקיים באחת קיים גם בשניה. כך למשל, יש סיכוי טוב שהביטוי "חמסין" יהיה קיים גם בעברית וגם בערבית, אבל סיכוי נמוך לכך שהוא קיים גם בשפת הנאוואחו. זו גישה שמתעלמת לגמרי ממבנה המילה, מהתקופה בה המילה נכנסה לשפה וממספר הדוברים הילידים המכירים את המילה; השיטה חוקרת רק את כמות המונחים משותפים לשתי השפות, ואולי גם את איכותם ותפוצתם.

מכיוון שסריקה מילונית היא עסק מסובך מאוד, החלטתי לעשות לעצמי הנחה מסויימת ולהשתמש בערכים בויקיפדיה כמקור. כלומר, הקשר בין שתי שפות ייקבע לפי מספר הערכים המשותפים לשתיהן. אפשר, כמובן, להרחיב את הבדיקה הזו למשפחות של שפות, כלומר לנסות למצוא קבוצות של שפות שמאופיינות על ידי מילים משותפות. חשוב גם לציין שבבדיקה הזו יש לא מעט בעיות והטיות סטטיסטיות – אבל הנושא עדיין מעניין מספיק בשביל לבדוק אותו.

כדי לבדוק את העניין כתבתי סקריפט קטן בפייתון. הסקריפט לוקח בכל פעם ערך אקראי מויקיפדיה העברית, ושומר בטבלה את רשימת השפות בהן מופיע הערך, למשל:

http://he.wikipedia.org/wiki/תא_אפנדימלי

en, ar, de, es, fa, fr, it, ja, pl, ru, sk, sl, sv

כלומר, הערך "תא אפנדימלי" קיים גם באנגלית, ערבית, גרמנית, ספרדית, פרסית, צרפתית, איטלקית, יפנית, פולנית, רוסית, סלובקית, סלובנית ושוודית. לעומתו, הערך "כ"ו בכסלו" קיים רק בעברית וביידיש (כן, יש פרייער ענציקלאפעדיע גם ביידיש, עם יותר מ7,000 ערכים – עסק מעניין בפני עצמו).

נצא מנקודת הנחה שמספר השפות אליהן מתורגם הערך הופכי לחשיבותו. כלומר, הערך על התא האפנדימלי תורגם ל13 שפות ולכן מספק אישוש חלש לקשר בין השפות, ואילו "כו בכסל"ו" תורגם רק לשפה אחת, ומספק לנו אישוש חזק בהרבה על הקשר בין עברית ליידיש.

כדי לכמת את הקשר, נגדיר את המקדם של כל ערך בויקיפדיה להיות ריבוע מספר השפות אליו מתורגם הערך. המקדם של הערך על התא האפנדימלי הוא 169 (13 בריבוע), ואילו המקדם של "כו בכסלו" הוא 1 (1 בריבוע). עבור כל ערך שנדגם, כל אחת משפות התרגום קיבלה ניקוד ההופכי למקדם. כלומר, סלובנית, שוודית ושאר השפות שהערך על התא האפנדימלי תורגם אליהן קיבלו 1/1690.00592 נקודות כל אחת עבור הערך, ואילו יידיש קיבלה נקודה אחת עבור כ"ו בכסלו.

צברתי את הערכים עבור 4,003 ערכים אקראיים מהויקיפדיה העברית (שהם כ4% מהערכים) והרי התוצאות:

ro 6.238
fi 6.302
sv 8.027
ar 8.420
ja 10.426
cs 10.829
pt 10.914
nl 13.281
es 14.357
it 15.747
yi 19.878
pl 20.503
ru 22.485
fr 30.873
de 31.004
en 290.949
831.000

קצת פרשנות

את מספר הנקודות הרב ביותר קיבל ה"אין תרגום", כלומר ערכים שאינם קיימים בשפות אחרות. צריך להזהר מעט מהנתון הזה, משום שיכול מאוד להיות שהערכים קיימים בשפות אחרת אך אף ויקיפד לא יצר קישור ביניהן. בכל מקרה, הנתון הזה מעניין כי הוא יכול לאפיין את היחידאות, או הבידוד, של שפה מסויימת.

השפות הבאות בתור, לפי סדר ניקוד יורד, הן אנגלית (290.9), גרמנית (31.0), צרפתית (30.87), רוסית (22.49), פולנית (20.50), יידיש (19.88) ואיטלקית (15.74). מעניין לשים לב לכך שהשפות הנפוצות בויקיפדיה, לפי סדר יורד, הן אנגלית, גרמנית, צרפתית, פולנית, איטלקית, יפנית וספרדית. הנתון המעניין כאן הוא שתי השפות שמספר הערכים המשותפים להן ולעברית גדול בהרבה מהסבירות הסטטיסטית – יידיש ורוסית. וכאן נראה לי שהצלחנו לקלוע יפה.

רעיונות…

  • עוד הרצות: אני מחכה בכליון עיניים להרצה הבאה של הסקריפט – על היידיש (אני מצפה לד מיון לעברית ולגרמנית), על שפה סקנדינבית ועל שפה מזרח אירופית.
  • ללמוד על מנגנון הקישורים הבין-לשוניים בויקיפדיה. איך נוצרים קישורים בין שפות? האם מדובר בתהליך חצי אוטומטי, או ידני לחלוטין?
  • התאמה סטטיסטית: לעבוד על ניתוח סטטיסטי תקף יותר לנתונים.
  • העלאת התוצאות לרשת בצורה מסודרת, אולי דרך אפליקציה בגוגל.
  • ויזואליזציה, אולי באמצעות דיאגרמות ון.
  • תרבויות ושפות: האם ייתכן שלא מדובר בקרבה בין שפות, אלא גם בקרבה בין תרבויות? למשל, הקשר בין רוסית לעברית יכול לנובע מקיומה של קהילה גדולה הדוברת את שתי השפות, ומתרגמת ערכים. זו מחשבה שהופכת את הפרוייקט, בעיני, למעניין הרבה יותר.

אשמח לתגובות.

[פוסט אורח מאת אדם מתן, מפתח תוכנה במקצועו, וסקרן תמידי בזמנו הפנוי. בוגר (בקרוב) של לימודי מדעי המחשב ותכנית כללית למדעי הרוח באוניברסיטה העברית. הפוסט פורסם במקור בבלוגו "הבלוג הכחול"]

Read Full Post »

[פוסט אורח של נמרוד גנצרסקי, עורך הג'רוזלם פוסט לייט]

תגובת הג'רוזלם פוסט:

עיתון הג'רוזלם פוסט לייט אינו מתיימר ללמד אנגלית בשיטה האקדמית אלא לשפר את השפה המדוברת. שיפור השפה השנייה בקרב מבוגרים שונה מהותית מלימוד שפה בקרב ילדים שאותה מייצגת המורה המבקרת, והג'רוזלם פוסט לייט לא עובד על פי כללי שפה שנקבעו על ידי משרד החינוך, שגם אותם מייצגת המורה המבקרת.

השיטה של העיתון בשיפור האנגלית בקרב מבוגרים דורשת שינוי טקטי בשיטת הלימוד, שכוללת חוויה בקריאה, קריאה רציפה, נושאים מוכָּרים, כתובים בקצרה ומעניינים. שיפור השפה האנגלית של העיתון גם לא כולל הבדלים תחביריים או לשוניים בין האנגלית הבריטית לאנגלית האמריקאית. המטרה של העיתון היא שיפור השיחה השוטפת של הקורא על ידי קריאה זורמת באנגלית מדוברת. כתבי הג'רוזלם פוסט אותם קוטלת המבקרת – הינם אנשי מקצוע אנגלוסקסים שכתיבה בשפת האם שלהם, אנגלית, היא המקצוע שלהם. אלפי מנויים מרוצים ואף התגובות בביקורת שלכם מדברות בעד עצמן.

Read Full Post »

Older Posts »