Feeds:
פוסטים
תגובות

Archive for אוגוסט, 2009

נעה הפנתה את תשומת לבי לפוסט בבלוג texts from last night:

(480): I just googled maps his house, and took the virtual tour back to my apartment, just so I could visualize the walk of shame in the morning

וכותבת:

"googled maps"?
רק לי הפועל הזה נשמע קצת מוזר?
אני הייתי הופכת את זה ל-"google mapped" או משהו בסגנון.

אני, בתגובה, הפניתי את השאלה לבלשן ארנולד זוויקי מסטנפורד, אשר כתב על הנושא פוסט בבלוג שלו בו הוא מסכם את ההופעות השונות של הביטוי ומגדיר אותו במונחים המקובלים בניתוח הדקדוקי האנגלי.

ואם כבר התכנסנו בהקשר, תהיה זאת הזדמנות טובה לשאול את המגיבים איך הם מתייחסים בעברית לפעולת החיפוש בגוגל. אני נוהג כבר שנים רבות לומר "גִיגַּלְתּי אותו", אך מבטים תמהים עד מגחכים מאנשים שונים הבהירו לי שהשימוש בהחלט לא סטנדרטי (על אף שאתרי טכנולוגיה שונים עושים בו שימוש חופשי ונטול הסברים למיניהם). יצא לי לשמוע לא מעט פעמים "עשיתי עליו גוגל", וגם יש כמה הופעות מתועדות ברשת, אבל באופן אישי הצירוף הזה נשמע לי כמו משהו שאומרות אמהות שצריכות להתקשר לבן שלהן רק בשביל להבין איך בכלל עושים חיפוש בגוגל (וסליחה מראש על הסטריאוטיפיות הלשונית, הטכנולוגית והמגדרית). כמובן שהאופציה התקנית "חיפשתי בגוגל" תמיד קיימת.

האם יש עוד אפשרויות שלא סקרתי?

Read Full Post »

אחד מחשבונות הטוויטר החביבים עליי ביותר הוא "רני רהב המזוייף", חשבון טוויטר פארודי אודות היחצ"ן המפורסם. אחד הדברים הבולטים ביותר בחשבון (מלבד העיסוק האובססיבי בעולם המדיה החברתית, נושא שלדעתי אינו עומד בראש מעייניו של רני רהב האמיתי), הוא השימוש הבלתי סטנדרטי בה"א הידיעה. מספר דוגמאות:

"איך אפשר להיות חבר בהטוויטר רק של עינב גלילי בלי גורי אלפי?"

"ישבתי פעם עם חברים מהויינט, שתינו צחקנו וחשבנו איך לקבע את הפריפריה בתור משהו מרוחק, מוזר, ביזארי, מפגר ומיושן. וכך באותו לילה נולד מיינט"

"קראתי בהמעיין כהן […] שכיום כדי לעבוד ביחסי ציבור צריך להכיר את המדיה החברתית. אבל לא כתוב את מי צריך להכיר כדי להיות כתב רשת"

ההתנסחות הזאת, כך נדמה לי, נועדה לרמוז על כך שלתחושת כותב הטוויטר האלמוני, דיבורו של רני רהב רווי בשימוש מיותר בה"א הידיעה. אך האם זהו המצב באמת?

למרבה הצער, כמעט ולא עמדו לידי התבטאויות אותנטיות של רהב על מנת לבנות קורפוס ראוי של כתביו. היות שיש יסוד סביר להניח שהתבטאויותיו בראיונות עמו משוכתבות ומסוגננות ע"פ דעתו של העורך הלשוני, הצלחתי להציג שני מסמכים שניתן להיות בטוחים באותנטיות שלהם. הראשון הוא הקלאסיקה "שלי רעה", והשני הוא תמלול שערכתי לדבריו בפאנל שנערך בפסטיבל ראש פינה האחרון (ניתן למצוא וידאו של כל הכנס בקישור המצורף. אורך הפאנל כ-45 דקות, ובמסגרתו רהב הוא אחד הדוברים המרכזיים, כך שהעניין סיפק כמות לא מבוטלת של טקסט).

ספירת השמות המיודעים בטקסט איננה משימה קלה, ולכן כדי לעשות את המשימה ברת ביצוע גם לעצלנים, הצטמצמתי לכדי ספירת השמות שמתחילים ב"ה" בלבד (כלומר, ללא יידוע שמתחבא בתוך צירופי סמיכות, שייכות או מילות יחס למיניהן), כיוון שכך או כך, עושה רושם שזהו המאפיין הלשוני הספציפי שכותב החשבון בטוויטר מנסה להגחיך. סקריפט פשוט צימצם עבורי את העבודה למילים שמתחילות ב"ה" בלבד, ומתוכן ניפיתי ידנית את התוצאות שאינן מילים מיודעות.

התוצאות:
במכתב "שלי רעה" ישנן בסך הכל 1326 מילים, מתוכן 129 הן מילים מיודעות שמתחילות בה"א, כלומר יחס של 0.0972.
בפאנל בפסטיבל ראש פינה יש בסך הכל 1180, מתוכן 104 מילים מיודעות שמתחילות בה"א, כלומר יחס של 0.0881.

רק על מנת להשיג אישור נוסף לתוצאותיי, נעזרתי בראיון נרחב שנערך עם רהב בגלובס. קל להבחין שהציטוטים של רהב בראיון עברו עריכה סגנונית (למשל, בראיון רני רהב משתמש במילה שנכתבת "קלישאה", בעוד שמי שיאזין לפאנל בפסטיבל ראש פינה, יבחין באופן די ברור שרהב הוגה את המילה הזאת "קִילְשאה"). בכל אופן, הצלחתי לגזור מהראיון 3985 מילים של רהב, מתוכן 325 הן מילים מיועדות שמתחילות באות ה"א, כלומר יחס של 0.0815.

ניכר שרני רהב די עקבי בתדירות שימושו בה"א הידיעה. אך האם השימוש שלו עומד בחריגה ביחס לשימוש בציבור הרחב? סוגייה מעניינת. למרבה הצער, לא הצלחתי למצוא סטטיסטיקה אמינה באשר לשימוש בה"א הידיעה בעברית ישראלית. הממשק החינמי של המילון ההיסטורי ללשון העברית של האקדמיה ללשון העברית מציין שהשכיחות של ה"א בתור תווית יידוע היא "32" (כך מדווח לי איתמר, אני עצמי ממש לא הצלחתי להשתמש באתר ש"מותאם לצפייה בדפדפן אינטרנט אקספלורר, גירסה 6.0 ומעלה"). מדובר בטקסטים מקראיים וזה גם לא נתון שאפשר לעשות איתו משהו. הלאה.
מיל"ה סופרים בערך 30,000 הופעות, אבל לא מציינים מה מספר התמניות הכולל בכל הקורפורה, וגם יש להם מילים מיודעות ברשימה (כמו "הממשלה") אז לא ברור לגמרי מה הולך שם.
באנגלית, אגב, התשובה מעט יותר חותכת: וולפראם אלפא מגלה ששכיחות המילה the בשפה כתובה היא 1/16, ובשפה דבורה 1/25 (כלומר, שני הערכים נמוכים מהאחוזים של רני רהב, אבל זה לא אומר הרבה). האם למישהו מהקוראים יש גישה לסטטיסטיקה יותר מהימנה?

אז מה כן? על מנת לקבל בכל זאת סדרי גודל, ניסיתי להריץ את אותו הסקריפט ובאותה שיטה על כמה טקסטים אקראיים ולא "חשודים" בעברית, כקבוצת ביקורת. בחרתי אקראית שלושה מאמרים מעיתונות הסופ"ש האחרון:  מאמר דעה של עמוס הראל ב"הארץ" על בוגי יעלון כלל 413, מתוכן 42 מילים מיודעות שמתחילות בה"א, כלומר יחס של 0.1016. כתבה היתולית של אור ברנע ב-ynet על אגדות אורבניות בעולם הרוק כללה 912 מילים, מתוכן 111 רלוונטיות, יחס של 0.1217. ואילו סקירה של עפר שלח ב-NRG אודות המשבר במשטרה כללה 1719, מתוכן 223 מילים שעונות על התנאים, כלומר יחס של 0.1297.

כמובן שהניסוי הוא יותר בגדר שעשוע וממצאיו אינם תקפים לגמרי, אך בכל זאת קצת מוזר לי מהיכן שאב מחבר חשבון הטוויטר את המאפיין הזה, שכאמור, כנראה איננו מתקיים במציאות: רני רהב משתמש בה"א הידיעה באותה תדירות כמו שאר האוכלוסייה.

Read Full Post »

והיום במסגרת פינתנו האהובה "התופעות המגניבות ביותר בעולם" ננסה להבין את המשפט הבא:

חולצה מטיילת בוואדי.

מי שהבין את המשפט על הנסיון הראשון – יש לי כמה אלקטרודות שאני מעוניין להדביק לראש שלכם כדי להריץ מספר ניסויים, אם אין לכם התנגדות. בינתיים הנה עוד כמה משפטים באותו הסגנון, הפעם באנגלית. הם בהחלט עשויים לדרוש קריאה שנייה, שלישית ורביעית בשביל להבין אותם כמו שצריך:

The horse raced past the barn fell.

The Russian women loved died.

The author wrote the novel was likely to become a best-seller.

The complex houses married and single soldiers and their families.

(אלה הפירושים הנכונים: חילצו מישהי שטיילה בוואדי; הסוס, שהוּרַץ לאורך החווה, נפל; הרוסי, שנשים אהבו, מת; הסופר כתב, שהרומן כנראה יהפוך לרב-מכר; הקומפלקס משכן חיילים נשואים ורווקים ואת משפחותיהם)

המשפטים האלה מעניינים בגלל שאנחנו מפרשים אותם לא נכון וחייבים לעצור לקראת סוף המשפט, לחזור אחורה, ולנסות להבין אותו אחרת. במשפט בעברית טבעי לחשוב ש"חולצה" היא שם עצם, אבל אז אנחנו נתקלים בבעיה משום שחולצה לא יכולה לטייל וחייבים לנתח את המילה אחרת, הפעם בתור פועל בסביל. משפטים כאלה מכונים garden path sentences משום שהכותב "מוביל" את הקורא לאורך שביל בלי שהקורא יידע שהוא הולך בכיוון הלא נכון. כל הסיפור הזה קורה בגלל שהמוח שלנו בוחר ניתוח תחבירי למשפט נתון בשלב מוקדם יחסית ורץ עם הניתוח הזה עד הסוף. מומלץ לקרוא את מה שגבי דנון כבר כתב על התופעה כאן (למרות שאני לא מסכים איתו לגבי המשפט שהוא מתאר, שנמצא מעל לסופרמרקט "חביב").

הבלשנית החישובית האיטלקיה פאולה מרלו (Paola Merlo) חוקרת בין היתר דרכים לזהות משפטים כאלה אוטומטית וטוענת שהם לא קיימים בכל השפות ואף קשורים בהכרח לפעלי תנועה: שימו לב שהחולצה מטיילת והסוס רץ. למעשה, מרלו טענה שאי אפשר למצוא משפטים כאלה בדנית וגרמנית (אפילו שהן שפות גרמאניות כמו אנגלית), אבל בסמינר שנערך ביוני שעבר הראו לה את ההיפך. נראה לי שמרלו מתמקדת בסוג מסויים מאוד של משפטים כאלה, אבל העניין הוא שישנם מספר גורמים: פעלי תנועה הם סוג אחד, אבל יש הרבה פעלים שאפשר להביע בסביל (כמו הרוסי שנשים אהבו). באנגלית במיוחד אפשר לשחק עם פסוקיות הזיקה ולוותר על המילה that, מה שגם תורם לאפקט. שוב, ראו ניתוח תמציתי אצל גבי דנון.

משפטי garden path הם אחת התופעות האהובות על תחבירנים, מהסיבה הפשוטה שהם דרך פיקנטית במיוחד להבין איך היכולות התחביריות שלנו עובדות. זו גם דוגמה אחת מיני רבות לדרכים בהן שפה יכולה להיות רב-משמעית. עד כמה שידוע לי, אין לתופעה הזו שם בעברית. אולי אפשר לקרוא לזה משפט חולצה? או אולי משפט חולצה מטיילת? אשמח לדוגמאות נוספות בעברית ולהצעות לשמות.

[ת' לרעות על הדוגמה המקורית בעברית]

Read Full Post »

באיחור של שבועיים הגעתי לכתבה של סיני גז בנרג, שולטתתתת ברשת: הסלנג האינטרנטי תופס תאוצה (נרג כלכלה, 9/8/09). גז רצה לכתוב על סלנג עברי ברשת ועשה בשכל כשראיין בין היתר את יקירי הבלוג עידו קינן (שמבין הרבה יותר באינטרנט ממה שאני מבין בבלשנות), ד"ר תמר עילם גינדין (בלשנית עם ראש על הכתפיים) וחגי גילר (איש השסק).

התזה העיקרית במאמר היא שסלנג מהרשת בדרך כלל לא "זולג" החוצה. חוץ מזה, המרואיינים גם מדברים על יכולתו של מישהו "מבחוץ" ללמוד את הסלנג התוך-אינטרנטי. בהחלט שווה קריאה.

[דרך חדר 404, אלא מה]

שולטתתתת ברשת: הסלנג האינטרנטי תופס תאוצה

Read Full Post »

רונן דורפן כותב בכותרת טורו ב"ישראל היום" היום את השאלה המסקרנת, שלא לומר הגורלית, הבאה:

"איך הקנייתים מסיימים ראשונים אבל לא עולים על הפודיום?"

בי דורפן הצליח להתל. היתה לי השערה, שהוא מדבר על התופעה של קנייתים שמתחרים תחת דגלי מדינות זרות תמורת תנאי אימון וכסף, וכך זוכים במדליות עבור בחריין וקטאר. אבל אז אמרתי לעצמי שזה לא יכול להיות: הרי אם השאלה שלו היא "איך זה שדגל קניה לא מתנוסס מעל טקסי המדליות?", כך הוא גם צריך לנסח אותה. הרי אותם הקנייתים שמהווים את נושאו של החלק הראשון של המשפט ("מסיימים ראשונים"), צריכים להיות הנושא של החלק השני ("לא עולים על הפודיום"). לצערי, זו בדיוק התופעה אליה הוא התכוון. מבחינה בלשנית, מה שדורפן עשה הוא לרקוד על שתי החתונות: חתונת הקנייתים של החלק הראשון – אנשים שנולדו בקניה, וחתונת הקנייתים של החלק השני – תת-קבוצה של הקבוצה הראשונה, ילידי קניה הרצים תחת דגל קניה. לתת כותרת כזאת אפשר רק אם אותם אנשים שמנצחים במירוצים לא עולים אל הפודיום (=זוכים במדליות), מה שכמובן לא קורה במציאות. זה לפחות השיפוט שלי.

חוסר זהירות? הטעיה מכוונת כדי ליצור עניין? או שאני והשיפוט שלי במיעוט? הבמה שלכם.

Read Full Post »

jpost-lite[עדכון: הנה משהו יותר עדכני עליו והנה הסקירה שלנו]

אנשי הג'רוזלם פוסט משיקים שבועון חדש, The Jerusalem Post Lite, שמיועד לעזור לדוברי עברית ללמוד אנגלית (הנה דיווח לדוגמה של ליאור ליברובסקי בקרח).

אם מי מקוראינו עוסק באופן מקצועי בהוראה או באנגלית, נשמח אם תסקרו עבורנו גיליון או שניים. לחילופין, מנויי הג'רוזלם פוסט שקיבלו עותק מוזמנים להעניק לנו אותו למטרת סקירה בבלוג. נא להשאיר תגובה כאן או ליצור קשר בדרכים הידועות. תודה!

[תוספת 26/8/09: אני רואה שכל יום מגיעים לרשומה הזו כמה אנשים שמחפשים את הג'רוזלם פוסט לייט. אשמח אם תיצרו קשר, כאן בתגובות או בפרטיות דרך טופס "צרו קשר", כדי להגיד לי מה אתם מחפשים. אם אראה שאנשים מתעניינים בעיתון הזה והיו רוצים לקרוא עליו סקירה כאן, אפנה למערכת הג'רוזלם פוסט כדי להשיג עותק לסקירה]


Read Full Post »

"בולטוּת", מסתבר, הוא התרגום העברי הלא-משהו למונח הפסיכולוגי (והפסיכובלשני) salience.

במובנו הפסיכובלשני, המונח בא לתאר את מה שיש לנו בראש כשאנחנו שומעים או קוראים מילה מסוימת או מבע מסוים, ויש לו נגיעה לתחומים פסיכופוליטיים (?) כמו דעות קדומות ואפליה. כך למשל, כשאומרים לנו "ציפור" אנו נחשוב באופן טבעי על הדרור או הפשוש (או ציפורנו הלאומית, הלא היא הדוכיפת) ולאו דווקא על קיווי או פינגווין, כיוון שאלה אינן ציפורים "ציפוריות" מספיק (מה שנקרא נציג פרוטוטיפי של הקטגוריה): ציפור באופן כללי מסוגלת לעוף. ישראלי שרואה את המילה "מורה" כתובה מולו יחשוב כנראה על מורָה (נקבה), אבל בריטי אולי על מורֶה (זכר). ההוויה מעצבת את התודעה, או משהו.

עד כאן דיברנו בהקשרים כלליים, אאוט אוף דה בלו. אבל מה קורה אם "מהנדסים לנו קצת את המוח" קודם? ניסויים רבים נערכים בתחום הזה, ולמשל מראים שאדם שמציגים בפניו כסף ואח"כ את המילה bank יחשוב על המוסד הפיננסי, לעומת מי שמציגים בפניו מים זורמים ואז bank הוא גדת נחל (המדידה היא לרוב של זמני תגובה לגירויי טקסט ותמונות). כלומר, ההקשר בהחלט יכול "להקפיץ" את הבולטות של איבר מסוים מקבוצה, או של משמעות אחת מתוך כמה של רצף אותיות, ולגרום לו להיות הדבר הראשון שקופץ לנו לראש בעת שמיעת המילה הרלוונטית.

אבל זה באמת היה על קצה המזלג (שלוש או ארבע שיניים?) כדי לחלוק עמכם את הדוגמה החיה שחוויתי על בשרי לא מזמן. דיברתי עם מישהו על הדלקת מדורה.

– "ואז הוספנו ענפים דקים, אפילו לא זרדים"

– "מה, מחטים?"

– "לא בדיוק מחטים, אבל כן בעובי של מחט. <הפסקה> ענפים בעובי של מחטי אורן"

שימו לב מה קרה כאן. כשבן שיחי שאל אותי על "מחטים", היה ברור שמדובר במחטי אורן, ובהקשר של משמעות זו עניתי. אבל כשהשתמשתי בביטוי "עובי של מחט", הזזתי את המשמעות השנייה של מחט (זאת שתופרים איתה) לעמדת המשמעות הבולטת, כי אף אחד לא אומר "עובי של מחט" ומתכוון למחט של אורן. שמתי לב באיחור, והייתי חייב לתקן את חוסר הבהירות שנוצר. הבהרה במקרה זה חשובה, כי מחטי אורן עבות פי כמה ממחטי תפירה. וכך בתוך אותו משפט הבולטות של הערך "מחט" זיגזגה לה הלוך וחזור בין שתי המשמעויות.

משהו מקיף יותר על נושאי בולטות ופרוטוטיפיות, אני מקווה, יפורסם בהמשך ימי הבלוג.

Read Full Post »

« Newer Posts - Older Posts »