Feeds:
פוסטים
תגובות

Archive for ינואר, 2010

פלאשבק לכיתה ג': מספר סודר הוא הדרך שבה אנו מסדרים פריטים (או ימים בשבוע): ראשון, שני, שלישי.

מספר מונה הוא הספירה הסתמית והרגילה שלנו, או הדרך לתאר בכמה פריטים מדובר: אחד, שניים, שלושה, שמונה עשר.

לא סתם הכנסתי את 18 הבעייתי (מדי) לכאן. בעברית מודרנית, כידוע לכולנו אחרי 20 שניות של כל ויכוח על שפת היומיום, יש צורת זכר ונקבה למספרים הסודרים (נו, ברור, הם שמות תואר) אבל גם למונים (וזה כבר יותר חריג בנוף הלשוני). ובמעין צחקוק גורלי של העברית המקראית, צורות המספר המונה של שמות עצם זכריים הם דווקא ההטיות הנקביות (בנפרד ובנסמך) ולהיפך.

אבל דווקא לא על זה רציתי לדבר, אלא על המספור הסתמי. פעמים רבות אנחנו סופרים פריטים, אנשים או חלקי ארנבת לא-מפורקים בלי לשרשר למספר את שם העצם, ואז אין התייחסות למין. אני מאמין שרובכם סופרים כמוני, על טהרת המספרים הנקביים: אחת, שתיים, שלוש, שמונה עשרה,… מי שזה נראה לו קצת מלאכותי, אז גם חת, שתיים,… זה בסדר. אני, לפחות, אף פעם לא מתחיל לספור עם אחד.

אלא מאי? כשאני מקריא למישהו מספר (למשל טלפון), אני תמיד אגיד אחד. כל שאר הספרות נשארות בנקבה. התבנית חוזרת גם במספרים שמופיעים בעשרות: בית מספר ארבעים ואחד נמצא ליד בית מספר ארבעים ושלוש (לפניו או אחריו?). עברית שפה מוזרה.

תופעות של מינים מעורבים בספירה קיימים: בצ'כית, למשל, יש צורת זכר ונקבה (ונייטרלי, אבל זה לא משנה) הן ל-1 והן ל-2, והמספור הסתמי משתמש דווקא בנקבה של אחת (jedna) ובזכר של שניים (dva). אבל שם זה נגמר – לשאר המספרים יש רק צורה אחת. בכל מקרה, אין שם את התופעה שבה בהקשרים שונים המינים מתחלפים. מספרי טלפון מוקראים כמו מספור סתמי. גם האקדמיה שלנו אוהבת את זה כך, ולראיה המספרים המוקראים באוזנינו על-ידי מענים אוטומטיים.

המשך…

Read Full Post »

נישאים על גלי ההדף של אירוע יומולדת לדורבנות, רוביק רוזנטל וגלעד צוקרמן ממשיכים להִדיין, כשהפעם האכסניה היא הבלוג של ידידתנו תמר עילם גינדין. צוקרמן קיבל אכסניה לפרט את התיאוריה ההיברידית שלו, ואני נחפזתי להגיב לכל פוסט-אורח שלו שם, משום שאני עצלן מכדי לעשות את זה כאן שלא רציני לקטול את התיאוריה שלו בבלוג שלי מבלי שקראתי את הספר עצמו מהתחלה ועד הסוף. למרבה המזל, אצל תע"ג יש לצוקרמן הזדמנות למחזר את מיטב טוריו ומאמריו ואפשר להגיב לכל נקודה ונקודה. הנה הפוסט הראשון, על דוברים ילידים (שעם רובו אני מסכים), והנה הפוסט השני, על מורפולוגיה (שעל רובו אני חולק).

Read Full Post »

פיליפ רזניק ממרילנד מתאר בלאנגואג' לוג איך קהילת הבלשנות החישובית נתרמת למאמצי הסיוע בהאיטי. על הפרק: קורפוסים מקבילים של מונחים רפואיים, שיפורים מהירים למערכות תרגום מכונה, הכנסת תגיות חכמות לטוויטים כדי שאפשר יהיה לכרות מהם מידע בצורה יעילה ומהירה, ועוד. מרשים מאוד.

עדכון 25/1: גם צוות תרגום המכונה של מיקרוסופט מנסה לעזור.

[גם לא-בלשנים-חישוביים יכולים לעזור בדרכם הצנועה. למשל בתרומה ליוניצ"ף או לארגונים אחרים]

Read Full Post »

אם מחפשים בגוגל {איורים של ארנבים}, גוגל יודע להציג עמודים רלוונטים בהם מופיעה דווקא המילה ציורים ולא איורים. קסם. גוגל הסבירו לאחרונה איך הם עושים את זה: יש להם אלגוריתם פלאי שמחפש מילים נרדפות ויודע להתאים אותן להקשר. טוב, אז אולי זה לא מי יודע מה הסבר, אבל אם זה מעניין אתכם אפשר לקרוא את ההסבר הרשמי של סטיבן בייקר מגוגל כאן.

עכשיו, אם אתם מפלצת אימתנית כמו גוגל ויש לכם מערכת שמטפלת יפה במילים נרדפות, למה שלא תשתמשו בה ביישומים אחרים? גנאדי למברסקי מהבלוג עיבוד שפות טבעיות בישראל בדיוק כתב על תרגום מכונה, איך זה עובד, למה גוגל שולטת בתחום ומה נקודות ההשקה היוכלתיות לתעשייה. זה בשביל מי שההסברים-נעבעך שלנו לא הספיקו לו. אפשר בהחלט להניח שגוגל משתמשת במערכת המילים הנרדפות שלה כחלק ממערכת תרגום המכונה שלה. עוד רקע בפוסטים המלונקקים לעיל. רק הערה קטנה ללמברסקי וקוראיו: לראש צוות תרגום המכונה בגוגל קוראים פרנץ-יוזף אוך, ולא אוץ'.

[דרך גוגל בלוגוסקופד, בלוג על גוגל]

Read Full Post »

מיכאל זילברמן (בעל בלוגים כאלה ואחרים) כותב בחדר 404 על גרפיטי סנובוני בצורת יX הY לאלתר, אתם יודעים, דברים כמו יפוטר האחראי לאלתר. זילברמן מתעד את הופעת "ילוהק דני איילון לאקספרס של חצות II", "יימכר אלי ישי לסוחרי עבדים הוגנים, אך אשכנזים", את "יצורף מאיר שטרית לקבינט של מוסוליני", וכן הלאה.

איפה זה התחיל? וואלה, לא יודע. אני עדיין לא יודע איך אפשר לחפש בצורה טובה הופעות ישנות של  יX הY לאלתר. חיפשתי לאלתר במאגר העיתונות היהודית ההיסטורית וזה החזיר הרבה יותר מדי תוצאות. ניסיתי לצמצם עם ולאלתר ולא קיבלתי שום דבר רלוונטי. אולי מי מקוראינו הנאמנים יוכל לחשוב על משהו, ועל הדרך להראות שאתם הרבה יותר מוצלחים מהמגיבים של חדר 404.

(דרך אגב, קראתי שהמילה היפה לאלתר היא בכלל שיבוש נפשע. במקור אמרו על אתר, כשאתר זה 'מקום' בארמית, כלומר 'על המקום'. אבל אתם יודעים איך זה, השפה של הילדים-של-ימינו שטוחה ורדודה והם לא מבינים כלום ומשבשים הכל ולא מלמדים אותם שום דבר בבית ספר כמו פעם שהיה לנו כבוד לשפה ועם זה יימשך ככה השפה העברית תימחק מהמפה)

Read Full Post »

יש מי שאומר שכאשר יש בשפה מסוימת הרבה שמות כדי לתאר דברים שונים, זה חיובי. אותי לימדו תמיד שהכל צריך להיות במידה, כך שגם יותר מדי שמות כדי לדקדק בהפרדה בין חפץ א' לחפץ ב' זה לא בסדר, לפי דעתי (אבל אף אחד לא שואל אותי, זה ברור). עכשיו, אם חפץ א' הוא כיסא וחפץ ב' הוא סוודר, ברור שצריכות להיות לנו שתי מלים נפרדות כדי לתאר כל אחד מהם. אבל אם חפץ א' עשוי בצק מוארך וחתוך בפסים ארוכים ודקים, וחפץ ב' עשוי אותו בצק אבל הוא חתוך בצורת קונכיות קטנות – אנחנו בעברית אומרים שזה הכל פסטה.

האיטלקים לא. באיטלקית יש שם לכל אחד מסוגי הפסטה השונים, ואותי אישית זה לפעמים מאוד מעצבן. בכלל, פסטה (pasta) זה שם כללי למוצרי בצק. גם הקרואסון הקטן שמלווה את הקפה בבוקר יכול להיקרא פסטה. אבל חלילה לנו מלהסתפק במילה היחידה הזאת כדי לדבר על כל סוגי הפסטה השונים: rigatoni, spaghetti, conchiglie, penne (ואם יש עליהן פסים אז אנחנו כבר מדברים על "פנה מפוספסות" – penne rigate), orecchiette, והרשימה עוד ארוכה וכוללת עשרות רבות (!) של שמות פסטה שונים. אלא מה, מדובר בדיוק באותו מוצר שמקבל כל פעם צורה שונה, והשם משתנה עם הצורה. לגבי הטעם – אם תשאלו אותי אין הבדל. לעומת זאת, מה שהאיטלקים טוענים, שצריך להתאים צורת פסטה מסוימת לרטבים ולתוספות השונות כי לא הכל הולך טוב עם הכל, זה נכון. למען האמת, אם אתם רוצים לאכול פסטה עם רוטב עגבניות ובשר טחון, עדיף להשתמש לאו דווקא בספגטי אלא בגלילים חלולים, ואם הם מפוספסים אז יותר טוב, כי הרוטב נכנס לתוך הגליל ונדבק אליו מבחוץ בין הפסים.

אבל אם תנסו להגיד לאיטלקי הפשוט שלספגטי ולגלילים החלולים, בלי רוטב, יש אותו טעם – ואני ניסיתי! – אוי ואבוי. זה יהיה אפילו יותר גרוע מלהגיד לישראלי הפשוט שגם הערבים הישראלים הם פלסטינים. במקרה הזה הישראלי יגיד: "למה? לא נראה לי" ואחרי שתסבירו לו שהם כולם בני העם הפלסטיני, רק שכמה מהם בסופו של דבר נשארו מעבר לגבולות הקו הירוק ואחרים נותרו בתוכם עם אזרחות ישראלית, או אז הוא עשוי לסנן "תכל'ס" ולהסכים עם העובדות.

אם תעזו להגיד לאיטלקי שלכל צורות הפסטה השונות אותו טעם, הוא יקצוף וישצוף בחמת זעם, יבטל את דבריכם מכל וכל ויצעק כמטורף: "מה פתאום! זה לא אותו דבר!" ושם תיגמר השיחה ביניכם, וכל שיחה פוטנציאלית אחרת בעתיד.

זהירות! אל תבינו לא נכון את דבריי: אני לא חושב שהשפה מעצבת את המחשבה, כפי שחשבו בעבר. אני לא מאמין בטענות השווא (שכבר הופרכו בעבר מעל דפי בלוג זה) על אלפי המלים שלאסקימואים יש כדי להגיד שלג, ואני מניח שהבדיחה של לומדי הערבית – שלכל שם עצם בערבית יש שלוש משמעויות: המשמעות הרגילה שלו, ההיפך של המשמעות הרגילה וגמל – היא לחלוטין מוגזמת. אבל נראה לי שקשה להטיל ספק בעובדה שלפעמים אנחנו ממציאים לשפתנו מלים ע"פ חשיבות השימוש בהן בחיינו. ככל שחשוב יותר להגדיר דברים מסוימים, כך יומצאו להם שמות שונים כדי להגדירם ולהבדיל ביניהם לבין דברים אחרים. לא השפה היא שמעצבת את המחשבה, אם כן, אלא אנחנו ממציאים בשביל עצמנו מלים ומושגים כדי להגדיר דברים שבחיי החברה והתרבות הספציפיים שלנו הם חשובים במיוחד.

מבחינה חברתית ופוליטית, להרבה ישראלים היה חשוב להבדיל בין ערבים ישראלים לפלסטינים, ולכן יש לנו שני מושגים שונים, עד כדי כך שהמון אנשים שכחו שמדובר בבנים לאותו עם. אבל מבחינה קולינרית, ממש לא אכפת לנו, הישראלים, מה בדיוק אנחנו אוכלים היום לצהרים ולכן לא משנה מה הצורה של זה – זה הכל פסטה.

לאיטלקים, מאידך, חשוב עד מאוד כל עניין האוכל – חשוב עד כדי כך שאם תנסו לערער על חשיבות זאת, בני שיחתכם האיטלקים ממש יאבדו שליטה, כמתואר – ומכאן אלפי השמות לצורות פסטה שונות, עד כדי כך שבמוחם של דוברי איטלקית הם הפכו למוצרי מזון שונים לחלוטין עם טעמים שונים לחלוטין. וזה לא נגמר רק בבצק: תמצאו המוני מלים שונות באיטלקית כדי לתאר מאכלים מכל מין וסוג: ירקות ופירות (למשל, אין לכם מושג כמה סוגי כרוב שונים קיימים באיטלקית!), גבינות, נקניקים עוגות ועוגיות וכו'.

מה לא חשוב לאיטלקים? למשל, לחלוק רגשות. לכן, בעוד שבעברית אנחנו מחלקים לכל עבר "מזל טוב", "שיהיה במזל", "בשעה טובה", "תתחדש", "חג שמח", "יומולדת שמח" ועוד, באיטלקית, כדי לתרגם כל אחד מהביטויים העבריים לעיל מספיק רק "auguri", ברכה שכוללת את כל המזל-טובים האפשריים, לכל אירוע שהוא. פירוש המילה הוא "איחולים", וזה אמור להספיק ככה, באופן כללי, בלי להיכנס יותר מדי לפרטים. ובאמת לא מעניינים את האיטלקים הפרטים של סיבת מסיבתך: אחרי המילה auguri הם מסובבים את הגב וממשיכים ללכת. בכנות, כשאומרים לך ככה "אאוגורי", אפשר ממש להרגיש את חוסר ההשתתפות בשמחתך. וזה עובד גם עם ההיפך, אם מישהו נפטר (גם אם הוא לא יהודי…): condoglianze, מילה אחת שפירושה "השתתפויות בצער", ואחריה הפנית גב והמשך הליכה אטית לכיוון השוק לקנות ספגטי או קונקיליה או פנה ריגאטה, תלוי ברוטב שתוכנן באותו יום לארוחת הצהרים.

הסתייגות עצמית לדבריי:

אם אמרנו שלא השפה היא שמעצבת את המחשבה אלא להיפך, לא מתקבל על הדעת שבחורה איטלקייה, למשל, שמכירה אותי טוב ושיש לי איתה קשרי חברות הדוקים, תגיד לי "אאוגורי" ליום ההולדת ולא תשמח באמת בשמחתי, כמו שתיארתי לעיל את התנהגות האיטלקים בדרך כלל. היא תגיד לי אאוגורי כי אין לה מילה אחרת לאחל לי מזל טוב, אבל מתוקף קשרינו אדע שהיא מתכוונת לכך בכל לבה ושהיא שמחה אתי כמו כל ישראלי שאומר "מזל טוב".

בכלל, כל המאפיינים הכוללניים של עמים, ארצות ותרבויות, עובדים רק כאשר מדברים בכלליות. כשיורדים לשטח לבחון כל אחד ואחד מהאזרחים הפשוטים, מסתבר שכולנו אנשים נורמליים וללא הבדלים בינינו (אבל זה כבר נושא לפוסט אחר בבלוג של אנתרופולוגים).

Read Full Post »

כמו בכל יום שישי, גם אתמול היתה עצרת מחאה נגד גירוש תושבים פלסטינים מבתיהם על ידי מתנחלים בשכונה הירושלמית שייח ג'ראח. הפעם העניינים הסתבכו קצת והמשטרה עצרה 17 מפגינים (ובסך הכל 70 בחמשת השבועות האחרונים; לטענתם שהותם שם היתה חוקית והמשטרה עצרה אותם באופן בלתי חוקי), ביניהם חגי אלעד, מנכ"ל האגודה לזכויות האזרח בישראל, שבאופן לא מפתיע כתב על דיכוי חופש הביטוי רק לפני שבועיים. למעוניינם, אלעד מעדכן על הנעשה בהטוויטר ובהפייסבוק.

בכל מקרה. לא על זה אנחנו מדברים עכשיו, זה רק רקע.

יצרתי קשר עם מישהי שהיתה בהפגנה והיא סיפרה לי שהשוטרים "עצרו … כל מי שרק מיצמץ לכיוונם", שזה נחמד, וממפגינים רבים נלקחו תעודות הזהות. זה כבר התמיה אותי: האם באמת מותר לשוטר "לקחת לי את תעודת הזהות ולעכב אותי עד שעתיים, הוא רק צריך לתת לי סיבה טכנית. גם זה הם לא נתנו"? הלכתי ובדקתי את לשון החוק בשני מקורות, חוק החזקת תעודת זהות והצגתה (1982) וחוק סדר הדין הפלילי (סמכויות אכיפה – מעצרים, 1996).

ראיתי שם מספר דברים. כידוע, תושב שמלאו לו 16 שנים חייב להציג את תעודת הזהות בפני שוטר, חייל וכן הלאה. בנוסף, שוטר רשאי לעכב תושב למשך עד 3 שעות אם הוא חושב שיש סבירות לעבירה, וגם במקרה הזה, התושב חייב להציג תעודת זהות ומסמכים רלוונטים. במקרה של עיכוב, השוטר חייב להודיע על כך רשמית למעוכב.

כידוע, פירוש לשון החוק היא עניין לעורכי דין ולא לאזרחים חצופים עליהם החוק חל, ולכן אני שמח להפנות את השאלה לקוראינו המשפטנים ו/או האקטיביסטים ו/או השוטרים: לפי הבנתי הלשונית, כשאני מציג משהו, מובן מאליו שהוא נשאר אצלי בזמן שאני נותן לבן-השיח שלי גישה חזותית אליו. האם הכוונה בחוק היא בעצם למסירת מסמכים, או שמשטרת ישראל בשיח' ג'ראח פשוט החילה חוק שונה?

[לפעמים אנחנו כותבים כאן על דברים, שעשוי להשתמע כאילו הם קשורים לפוליטיקה. זה בגלל ששפה קשורה לכל דבר שאנחנו עושים כבני אדם, וגם בגלל שאלה דברים שמעניינים אותנו, ממש כמו שאנחנו כותבים על כדורסל. במילים אחרות: זה בלוג על שפה, נקודה, אז נא לדאוג שהתגובות יהיו ענייניות. ובכל זאת, אנחנו בלוג שמתנהל בשקיפות, אז הנה גילוי נאות: הח"מ הוא חבר באגודה לזכויות האזרח ופגש את חגי אלעד פעם או פעמיים בחטף]

Read Full Post »

צ'אטים להעורך: הקורא הערני דוד הפנה אותי למסמך שיחס האורך/עלגות שלו לא היה מבייש משהו מאוד קצר ומאוד עילג. מדובר במסמך קווי היסוד של הממשלה הנוכחית, שכבר בהתחלה נקראת "הממשלה ה-32 בנימין נתניהו", אולי כי מישהו העתיק רק שורה אחת מטבלה או כי המילה "בראשות" נכתבה בגופן זר, ובהמשכו מורבצות פנינים כמו "הממשלה תפעל באופן אקטיבי" ו"תעמיד את החינוך במרכז סדר העדיפות הלאומי" (כלומר איפשהו באמצע).

אך את הקורא הערני דוד עניין פרט מעניין אחר:

יש אינטרס כלכלי, ויש אינטרס ביטחוני, וכו' וכו'.
יכול להיות אינטרס היסטורי? (קו שני במסמך -י.פ) כלומר, האם מתייחסים למילה אינטרס בתור מקבילה ל"עניין"?
או שיש לה משמעות שונה וחמקמקה?

אז יצא לי כבר לכתוב בבלוגי לא אחת (אלא שתיים) על יצירתיותו של מבנה הסמיכות בעברית, אבל עד לדוגמה זו לא ממש חשבתי שלצירוף צמידות (שם עצם + שם תואר) יש כל כך הרבה מה להציע. כיוון שטרם שמעתי את הביטוי "אינטרס היסטורי", הרגשתי חופשי להעלות כמה רעיונות לגבי מה יכול להיות שם:

  • בעל האינטרס רוצה לעשות משהו כדי להיזכר באופן מסוים בהיסטוריה
  • בעל האינטרס רוצה לעשות משהו מתוך מחויבות לדורות הבאים
  • מקור האינטרס היסטורי (עד כדי תנ"כי)
  • מקור האינטרס הוא "מסיבות היסטוריות", כלומר חסר נימוק הגיוני
  • האינטרס קיים זמן רב
  • האינטרס עצמו הינו בעל משמעות היסטורית (כלומר זו פעם ראשונה שמעלים אותו כאינטרס)

גיגול קצר העלה ערב רב של רוב האפשרויות שהצעתי לעיל (ובסך הכל עשרים וחמש תוצאות, עבור צורת הרבים והיחיד גם יחד. אז לפחות זה לא נפוץ). אבל קשה לי לראות את עצמי משתמש במילה "אינטרס" במצבים הרלוונטיים. אולי "עניין", או "מטרה", או "יעד".

ומה אומרים אתם, קוראינו? הגם לכם זה נשמע כמו צירוף לא מוצלח? ולאיזו מהאפשרויות לדעתכם התכוונו במסמך שכונן את ממשלתנו?

Read Full Post »

מנהג שכזה יש להם לטרחנים ולקטנונולוגים, להתלונן על צירופים כמו לקחת מקלחת, לקבל החלטה או לשים סוודר. יש כל מיני סיבות לא לאהוב תרגומי-שאילה כאלה מאנגלית (take a shower), אבל אחד הטיעונים העיקריים נגדם גורס שהם מרדדים את השפה. התייחסנו לנושא הזה פעם או פעמיים או אולי קצת יותר, לרוב עם קישור לאורן צור או לפוסט מתווה-עיקרון של גבי דנון. עמיתי המלומד פינטר התרתח לא מזמן על 'לעשות', ובמידה לא מועטה של צדק.

כעת קחו את המשפטים הבא לדוגמה:

  1. אני עושה מקלחת.
  2. אני לוקח מקלחת.
  3. אני מתקלח.
  4. אני עושה מקלחות ארוכות מדי (וזה מבזבז מים).

אבוי! מישהו עושה כאן מקלחת כשהוא אמור פשוט להתקלח! אבל תסתכלו על משפט (4) – האם יש דרך טובה להביע אותו בעזרת הפעל מתקלח?

  • ??אני מתקלח באריכות.
  • ??אני מתרחץ ממושכות.
  • ?אני מתקלח זמן ממושך מדי.

מצד אחד, בכל ההיסטוריה של השפה האנושית שפות השפיעו זו על זה והעשירו אחת את השניה. מצד שני, קטנונולוגים שונים מתעקשים שדברים כאלה מדרדרים את השפה. אמנם אני לא אוהב את הביטוי לקחת מקלחת כעניין של טעם אישי, אבל אי אפשר לטעון שהוא בהכרח נחות מהמילה מתקלח.

Read Full Post »

העמיתים מדורבנות חוגגים ב-14 בינואר שנה באוויר עם ערב מרשים למדי שבמרכזו הרצאות מפי שלושה תותחים כבדים:

  • "למי קראת הומופון?"ד"ר תמר עילם-גינדין על מבעים שנשמעים אותו דבר, משחקי שמות, משפטים שתרגומם אבד כמו "פעם שלישית גלידה", ועוד.
  • "השפה ככלי משחק" – רוביק רוזנטל על למה אנחנו אוהבים לשחק בשפה, מהם כלי המשחק של השפה, ומדוע העברית החדשה היא שדה משחק בלתי נגמר.
  • "שמע ישראל או צ'מע ישראלית?"פרופ' גלעד צוקרמן על ההיברידיות והילידיות של השפה המדוברת כיום בארץ.

סחתיין לדורבנות וסחתיין גם למגיב מס' 2, "ההיברידיות והילידיות", ששאל אם ההרצאה של צוקרמן תלווה בתרגום סימולטנית לעברית.

Read Full Post »

[המגיבה המתמידה דפנה חונכת באופן רשמי את המדור מכתבים להעורך, שהוא השם שאנחנו נותנים לשאלות שאנשים שואלים אותנו. למה דווקא "להעורך"? כי ברוח היידוע המיותר, בן לי חיפש בארכיון העיתונות היהודית ההיסטורית ומצא שפעם כתבו כך גם בעברית (בעיתון האור, ממשיכו של הצבי). אם כן, מכתבים להעורך.]

שאלתה של דפנה נוגעת לציטוט הבא מתוך כתבה שתורגמה עבור הארץ מאנגלית (מדענים: מצאנו שרידים לקיומו של החומר האפל על כדוה"א, 20/12/2009, ההדגשה שלי):

בהודעה מתואמת שפרסמו כמה מעבדות בארה"ב, מסרו מדענים שהם מאמינים כי "לכדו" חלקיקים של החומר האפל במכרה ברזל במינסוטה, בעומק של קילומטר מתחת לפני האדמה. הטענה, אם תוכח בשנה הקרובה, תיחשב לאחת התגליות הגדולות בפיזיקה במאה האחרונה.

דפנה שאלה את עצמה: ואם הטענה לא תוכח בשנה הקרובה אלא עוד שנתיים או שלוש, אז מה? האם הכוונה שאם הטענה לא תוכח במהלך השנה הקרובה, היא לא תוכח בכלל? "איכשהו נראה לי שזה מידע נפרד או נוסף, ושזו לא הדרך האינטואיטיבית שבה אני מפרשת את המשפט." היא גם תהתה אם באנגלית זה נשמע יותר טוב, וכך היה כתוב במקור (איאן סאמפל, הגארדיאן, האם החומר האפל סוף סוף נתגלה? 17/12/2009):

In a series of coordinated announcements at several US laboratories, researchers said they believed they had captured dark matter in a defunct iron ore mine half a mile underground. The claim, if confirmed next year, will rank as one the most spectacular discoveries in physics in the past century.

במהלך ישיבת חירום שכינסתי במשרדי 'דגש קל' כדי לדון במשפט, לחלק מהמשתתפים היו דעות אחרות (בגלל שבהתחלה שלא הבנתי נכון את השאלה של דפנה) לגבי הבעייתיות שבו.

  • סמנטיקאי הבית היה נחרץ: 'המאה האחרונה' הוא ביטוי הגיוני רק אם מעבירים את נקודת ההתייחסות למתי שהטענה תוכח. כלומר, מיום ההוכחה צריך לספור 100 שנים אחורה, וזוהי המאה המדוברת. המשפט מעט משונה כי צריך לעשות את הטריק הזה, אבל הוא מובן.
  • המתמטיקאי הסכים: אולי יש בעיה קלה של זמנים ובגללה המשפט מעט משונה, אבל הוא התקשה למצוא בו בעיה של ממש.
  • איש השפות טען טענה לקסיקלית: ברגע שהטענה תוכח, היא לא תהיה טענה יותר אלא תגלית. באנגלית אפשר לאשר טענה והיא עדיין תהיה טענה (claim), אבל בעברית כשמוכיחים טענה היא הופכת לתגלית. המשפט מעט משונה כי צריך לעשות את הטריק הזה, אבל הוא מובן.
  • הסכמתי עם דעתו של איש השפות. נדמה לי שעניין המובע באמצעות claim הוא חזק מעט יותר מאשר עניין המובע באמצעות טענה, ולכן עם claim המשפט עובד ועם טענה הוא מעט משונה וצריך לעשות את הטריק הזה.
  • מעבר לכך, הוספתי הערה נוספת בכובעי כתחבירן זוטר, וזו חוזרת לעמדתה המקורית של דפנה: כשקוראים את המשפט צריך להבדיל בין [אם תוכח [בשנה הקרובה]] (כלומר בנקודת זמן מסוימת, שהיא למשל השנה הקרובה) ובין [אם [תוכח בשנה הקרובה]] (כלומר בהכרח ב-2010 ולא באף שנה אחרת). המשפט מעט משונה כי צריך לעשות את הטריק הזה, אבל הוא מובן.

אם נסכם, הרעיון הוא כזה: תנו לסטודנט לבלשנות משפט, תשאלו אותו איך הוא מסביר את הבעייתיות שבו, והוא כבר ימצא משהו. בסופו של דבר, לא מדובר במשפט בעייתי מדי, אבל יש כמה סיבות מדוע הוא עשוי להישמע מוזר.

Read Full Post »

אני לא יודע איך אפשר לעשות כסף מעיבוד שפה טבעית בישראל. גם גנאדי למברסקי לא מרוצה מהשילוב בין האקדמיה והתעשיה בארץ, אז הוא החליט לדחוף את העניין באמצעות בלוג חדש, עיבוד שפות טבעיות בישראל שמו (אם כי אני הייתי מעדיף עיבוד שפה טבעית, ביחיד). ניתן לפוסט הראשון לדבר:

איחוד אירופי משקיע כמיליארד יורו מדי שנה כדי לתרגם את כל המסמכים הרשמיים ל-20 שפות ומשווע למערכת תרגום אוטומטית. ארה"ב משקיע הון עתק כדי לעקוב אחרי כל מי שהשתמש במילה ג'יהאד ברשת ו/או שיחת טלפון. אך, המנוע הכי חזק לעלייה בפופולריות של תעשיית השפה הוא ללא ספק האינטרנט. Yahoo מדווחת על 5 ג'יגהביית של מידע שעובר יום-יום דרך מנוע החיפוש שלהם. וזה רק משאילתות. ענקי האינטרנט, כמו Google ו- Yahoo, עוברים להשתמש בשיטות חישוביות לאיבוד טקסט […]

אז למה בישראל התחום מקרטע? למה אנחנו לא מובילים את העולם כמו בתקשורת או IT ? […] עדיין, אין בארץ מספיק תעסוקה למומחים בטכנולוגיות השפה – מה שמרתיע מסטודנטים חדשים להיכנס לתחום. אנחנו צריכים שהאנשים אשר מסיימים היום את לימודיהם בתחומים הקשורים לטכנולוגיות השפה יפנו ליזמות (לפחות חלקם) במקום לחפש תעסוקה במרכזי מחקר של Google, IBM, Yahoo או Microsoft. הדבר ייצור מקומות עבודה חדשים וימשוך סטודנטים חדשים לתחום. הסטודנטים האלה גם יפנו ליזמות ואולי-אולי תהיה לנו מסה קריטת הדרושה כדי להקים CheckPoint, Comverse או NICE הבאים – כל החברות האלה צמחו מתחום נישה.

בסוף הפוסט מבטיח גנאדי לסקור את תתי-התחומים השונים בבלשנות חישובית בפוסטים הבאים, בדגש על מיזמים אפשריים ודרישות השוק, כדבריו.

[ת' ליונתן]

Read Full Post »

שר החינוך גדעון סער, יש לציין, לומד במהירות מטעויות. זה אך מספר ימים לאחר שהכריז קבל עם ועדה על תוכנית לימודים מעוררת מחלוקת על עולי הגרדום, בחר סער בהצהרתו הבאה בתוכנית לימודים שאין לה ברירה אלא לעורר גל תמיכה ציבורי מאסיבי: עידוד השפה העברית! תיקון שגיאות! חמש דקות מדי בוקר של קטנונולוגיה איכותית לילדינו הרכים. היש מי שיתנגד לזה? ראו-נא כיצד הטוקבקיסטים עטים על המציאה בחדווה רבה, כל אחד חמוש בסל קיטורים משלו.

למעשה, אני משוכנע שיעלה בידם של משרד החינוך לאסוף מהציבור כל כך הרבה תיקונים ושגיאות, עד כי חמש הדקות מדי בוקר למשך כל בית הספר היסודי וחטיבת הביניים לא יספיקו על מנת להכיל את כל העושר הלשוני הזה. יתכן כי אף יהיה צורך להרחיב את מסגרת 5 הדקות למסגרת בת 45 דקות, אשר תקרא "שיעור לשון" ותיערך פעמיים או שלוש בשבוע. על מנת לוודא שלא מצטבר פיגור בשאר הנושאים רמי המעלה שעומדים על סדר יומם של תלמידי כיתות היסוד, יחולקו גם שאר הנושאים לפרוסות-זמן בנות 45 דקות וישתבצו להן במערכת השעות.

אבל אם להיות רציניים לרגע: ראשית כל, נסיון הדורות מלמד אותנו שאין להתייחס לכל הודעה לעיתונות כפשוטה. מדי מספר שבועות מגיעה היוזמה החינוכית התורנית אשר עושה כותרות. אם היינו מאמין לכולן, הרי שמצעד המורים בבתי הספר היה מורכב מעולי גרדום, קצינים בכירים, אנשי רוח ובוגרי תוכניות ריאליטי. רצה הגורל והפעם נפל הפור על ענייני שפה.

עוד יש לומר, כי אם "מטרת התוכנית המתגבשת היא שיפור המיומנויות בשפה בעל פה ובכתב, טיפוח שפה תקנית, העלאת המודעות לשפה והעשרתה, שיפור תרבות הדיבור והדיון והיכרות עם המורשת הלשונית של התרבות העברית ותולדותיה", הרי שקשה יהיה למצוא מתנגדים; מה שלא ברור הוא, כיצד דיון יומי של 5 דקות, במהלכו תנסה המורה חסרת הישע לדקלם לתלמידים דף מסרים פסקני של האקדמיה ללשון העברית, אשר פסגת טיעוניו היא "כי ככה זה", יתרום להשגת כל המטרות האלה. יתרה מכך, הציטוט המובא מפיו השר סער, "בחברה הישראלית השיח מתבסס על אוצר מילים דל, שיבושי לשון רבים, קשיים בהתבטאות בעל פה ובכתב", מעיד יותר מכל על צרות אופקיו ועל פופוליזם זול. נביאי "קץ התרבות", אשר מזהירים אותנו יומם וליל מקריסתה המוחלטת של תרבותנו עקב האינטרנט, או הטלוויזיה, או השד יודע מה, אינם חסרים. אדרבה, שלושה או ארבעה מהם כותבים טור קבוע בכפולה הפותחת של "7 לילות". הם עושים זאת, אגב, בשפה מצויינת, מדוייקת ומצליפה.

הגדילו לעשות ב-ynet, וליקטו רשימת "שיבושים נפוצים" אשר ליקטו במשרד החינוך. כל מי שעוקב ולא ברפרוף אחר ספרות קטנונולוגית ודאי יכיר את רובם: הצירוף המסכן "במידה ו", למשל, אשר פותח משפטי תנאי, זוכה כבר עשרות שנים לכינויים מעליבים מצד טהרנים: "טעון עקירה גמורה", "סר טעם", "מגונה", "משונה", "אין הטעם הטוב סובלו", "מיותר מעיקרו", "שיבוש גמור", "אין לו זכות קיום כלל". כל אדם סביר אשר עלבונות שכאלה היו מוטחים בו היה ממהר להיעלם, אבל "במידה ו", עקשנית שכמותה, ממשיכה לחיות ולהתעלם מזעם המילים המיותר.

אבל פריט אחד בטבלה הפתיע גם אותי: המילה ה"לא תקינה" היא "עומסים", והמילה התקינה היא "עומס (לא ניתן לריבוי)". סליחה, אבל מה? קודם כל, זה לא תיקון, אלא פשוט פסילה תמוהה של צורה שימושית ביותר. כי אתם מבינים, אם יש עומס תנועה אחד באיילון צפון מרוקח עד קיבוץ גלויות, ועומס תנועה שני בכביש החוף ממחלף נתניה עד מכון וינגייט, ועומס תנועה שלישי בכביש 70 מצומת סומך ועד צומת יגור (וכמובן שכולם מתקיימים בו-זמנית), אז יש עומסי תנועה. ואם למכונה אחת יש עומס מקסימלי אחד, ולמכונה שנייה יש עומס מקסימלי אחר, ויש לכם עוד כמה מכונות, זה דווקא מאוד הגיוני לרכז במקום אחד טבלת עומסים, וזה לא מאוד יעניין אתכם אם משרד החינוך יגיד אחרת.

לא נותר אלא להתנחם בכך שגם חמש דקות ביום לא ישכנעו את הדוברים העקשנים להפסיק לעשות בשפה שלהם כבשלהם, ולגרום לה להיות כל כך שימושית, לעזאזל. אפשר רק להצר על כל המאמצים שיתבזבזו בדרך לתובנה הזאת.

Read Full Post »

ב'הארץ' כותב יניב קובוביץ' על קו הברחת קוקאין (חשד: אם מבוליוויה ושתי בנותיה הבריחו סמים בגופן, 23/12/2009):

שלשום בשעות הלילה נחתו בישראל שלוש נשים מבוליוויה, אם בשנות ה-40 לחייה ושתי בנותיה בנות ה-20. בלשי ימ"ר תל אביב הגיעו למלון בתל אביב שבו התאכסנו הנשים, ואיתרו אותן כשברשותן 2 ק"ג סמים מסוג קוקאין, ארוזים בצורת "זרגים".

סליחה? זרגי קוקאין? מסתבר שכן, כמו שהסבירה לי כתבה של גלעד שלמור מערוץ 2 בחודש שעבר (ההדגשות שלי):

כשפתחו הרופאים את בטנו של הפציינט, נדהמו לגלות בתוכה 5 קונדומים מלאים בסם מסוג קוקאין במשקל נקי של 306 גרם – המכונים בעגה העבריינית "זרגים". המנתחים הוציאו את ה"שלל", סגרו את בטנו של האיש, ומיהרו כמובן להזמין את המשטרה.

לא פין, לא זין ולא אף מילה אחרת שמתארת בימינו את איבר המין הזכרי; נבחרה דווקא המילא הספרותית זרג. אני חושב שזה יצירתי, מקורי ונהדר. נדמה לי שיש לפעמים נטייה להשתמש במילים ספרותיות יותר בסלנג עברייני, אבל לא הצלחתי למצוא מחקרים בנושא.

הערת אגב: עכשיו שיש לנו פוסט על זרגים, אפשר רק לדמיין מה יביא אנשים לאתר הזה.

Read Full Post »