Feeds:
רשומות
תגובות

Archive for the ‘סוציולינגוויסטיקה’ Category

שטף תשדירי התעמולה תפס אותי לא מוכן השנה, ואני מודה שהתקשיתי לעמוד בקצב הדאחקות של ביבי ושות'. אבל שני סרטונים של הרשימה המשותפת מעלים על ראש שמחתנו את תופעת הדיגלוסיה: ההפרדה בין שפה תקנית לשפה מדוברת.

בסרטון החביב הבא מגיעים מנהיגי שלל מפלגות בזה אחר זה ומציקים למשפחה הממוצעת באמצע ארוחת השבת, עד שמגיע אימן עודה מהרשימה המשותפת ועושה סדר. כשאב המשפחה מציע לו כיסא, עודה משיב: "תביא חמישה עשר כיסאות" (חמישה עשר מנדטים). אבל מי אומר "חמישה עשר" בימינו? עודה אומר.

זה לא מקרה שדווקא הערבי, "האחר", מדייק בהתאמה במין ובמספר. רבות כבר נאמר בנושא, במיוחד בהתייחס לשפתו של זוהיר בהלול, ולא איכנס לעניין כאן. באופן כללי נראה שמדובר בשילוב בין החובה שחלה על תלמיד ערבי להצטיין במיוחד בשביל להגיע להישגים כלשהם בחברה היהודית, עם איזושהי התרסה שדווקא מי שמגיע מבחוץ מדבר עברית מדויקת יותר מהיהודי. אפשר להתחיל למשל עם הראיון הקצר הזה עם בהלול (שלא נכנס לפן הפוליטי-החברתי).

בסרטון נוסף של הרשימה המשותפת אנחנו עוברים לערבית וזוכים לראות הפרד קלאסית בין עברית מדוברת לערבית ספרותית:

מה שמשך אותי במיוחד הוא העובדה שהדרדסים משוחחים בערבית מדוברת מקומית, בעוד ליברמן ובנט מדברים בערבית ספרותית (ונדמה לי שהמבטא של בנט "משוכנז" מעט). בדקתי בכמה סרטונים מדובבים לערבית של הדרדסים באינטרנט, וזו לא הפרדה שקיימת במקור בין הדרדסים וגרגמל: בטלוויזיה כולם מדברים בספרותית. מצד אחד, אני מניח שהדרדסים אמורים להישמע אותנטיים יותר ואילו ליברמן ובנט ממסדיים ומנוכרים. מצד שני, אני לא חושב שבת דמותה של יונית לוי אמורה לעורר אנטגוניזם מיוחד.

ואם הדיגלוסיה היא הדבק שמחבר בינינו, דיינו.

[ת' לשי. ועכשיו יאללה להצביע]

Read Full Post »

(First posted on Language Log as a guest post)

Reading Mark Liberman's analysis of Obama's SOTU addresses versus other presidents', my thirst remained unquenched. Word-counts are fun, sure, but the real fun comes in when looking at longer phrases – two (bigrams) or three (trigrams) words long.

After waiting for it to be breakfast time in Philadelphia, I engaged in an experiment (Legal has advised me against explicit use of MYL's trademark phrase) to analyze the 228 addresses (found here) and see what Obama's favorite (and least-favorite) phrases are.

Since I worked with raw data, I handled it a bit differently than previous analyses just for the sake of getting results fast. To begin with, I did not weed out the non-orally-delivered addresses or any other "special" cases. Next, I used an unsophisticated tokenization algorithm where all apostrophes break words into tokens (so "Congress's" is split in two, as in Liberman's analysis, but same goes for "i'm" and "he's"). Lastly, I used a comparison algorithm which only takes into account Obama's speeches and all addresses (1790-2014) as "background": the KL measure, which purports to tell us how "informative" the phrase is in the Obama corpus relative to the background corpus.

Let's get to it: here are Obama's most unexpectedly frequent bigrams:

bigram KL-measure X 1000
that 's 3.284
it 's 2.463
let 's 2.022
don 't 1.545
i 'm 1.540
we will 1.408
's why 1.375
we 're 1.278
we 've 1.253
can 't 1.147
right now 1.092
clean energy 0.960
i will 0.946
if you 0.931
need to 0.925
we 'll 0.907
we can 0.902
is why 0.883
jobs and 0.848
's what 0.844
health care 0.842
tonight i 0.825
our economy 0.813
's not 0.736
middle class 0.696

We see many stylistic markers here, such as the contracted forms "'s", "'re" and "'ll", which will probably re-appear in any modern president's lingo (with not much to support either the egocentric-Obama or collective-Obama hypotheses), but these expected bigrams greatly emphasize the magnitude of the more content-swayed ones: "our economy", "middle class", "health care" and the number one issue on Obama's plate (at least according to Kullback and Leibler): "clean energy".

Obama's most unexpectedly infrequent bigrams: (for these, I still only took phrases which appeared somewhere in Obama's addresses)

bigram KL-measure X 1000
of the -2.388
to the -0.941
in the -0.896
for the -0.529
and the -0.494
by the -0.446
it is -0.397
PAR the -0.392
united states -0.389
the united -0.388

And the rest is just as boring. We've seen "the" is on the decline, and it drags down all its associated bigrams with it.

Moving on. Favorite trigrams: ("PAR" marks the beginning of a paragraph)

trigram KL-measure X 1000
that 's why 1.191
that 's what 0.750
that is why 0.640
democrats and republicans 0.549
we need to 0.526
it 's not 0.495
this congress to 0.432
PAR that 's 0.426
the american people 0.413
i will not 0.406
so let 's 0.405
tonight i 'm 0.399
we can 't 0.391
states of america 0.369
it 's time 0.353
across the country 0.336
's why i 0.325
's why we 0.324
over the last 0.319
over the next 0.313
we have to 0.312
i took office 0.312
i know that 0.310
's time to 0.304
PAR of course 0.304

So the top three are explanation starters, but check out "democrats and republicans" creeping in to a bipartisan content-lead. And you may take what you will from number 25, beginning paragraphs with "of course".

Least favorite trigrams:

trigram KL-measure X 1000
the united states -0.375
of the united -0.134
of the country -0.054
part of the -0.048
as well as -0.046
the people of -0.044
of the people -0.044
PAR it is -0.043
united states and -0.040
of the government -0.032
the secretary of -0.030
it will be -0.029
the federal government -0.029
and it is -0.026
and in the -0.026
at the same -0.026
of our citizens -0.026
the number of -0.025
of the last -0.024
the fact that -0.023
of the union -0.023
in order to -0.022
it is not -0.022
and to the -0.022
it is a -0.022

A bit more interesting than the lost bigram table. "the american people" made it to the top, but "the people of" are on the bottom, suggesting nothing but a stylistic anomaly (or shift) in denoting what is probably the group which is most referred to in these addresses. How "the united states" and "states of america" got to opposite ends is beyond me, though. Much to look into, perhaps during some breakfast after next year's SOTU.

Read Full Post »

הפרסומת הבאה לקוקה קולה שודרה אתמול במהלך הסופר בול. השיר הפטריוטי America the Beautiful הוקלט במספר שפות ונשא איתו מסר מלבב של אחדות, חירות, צרכנות וכן הלאה:

ב-Language Log תיעדו את הסיקור התקשורתי ומנו את השפות המשתתפות בקליפ:

Coca-Cola ran a commercial with a multilingual rendition of "America the Beautiful," with languages including English, Spanish, Keres Pueblo, Tagalog, Hindi, Senegalese French, and Hebrew.

אני לא שמתי לב לעברית כשראיתי את הפרסומת, אבל השורה הלפני-אחרונה (החל משנייה 43) היא באמת בשפת הקודש: משהו כמו "ברוב טובך יכתיר אותך" (אני לא בטוח לגבי המילה הראשונה), תרגום של חלק מהשורה המקורית "And crown thy good with brotherhood".

למזלנו החברה סיפקה מבט אל מאחורי הקלעים ובו ניתן לשמוע חלקים נרחבים יותר מהשיר. הנה מעט יותר על הביצוע בעברית, של ילדה בשם נטלי:

למה קשה להבין את המילים בשמיעה ראשונה? יש כמה סיבות. ראשית, התרגום מילולי למדי. שנית, ההגייה של נטלי משקפת את העובדה שהיא (ככל הנראה) גדלה בארה"ב. לא נדיר להיתקל בילדים דוברי-עברית שגדלו בארה"ב וההגייה שלהם מושפעת מהפונולוגיה של אנגלית; רמת השליטה שלהם בעברית עשויה להיות טובה מאוד או גרועה למדי (מה שנקרא heritage speakers) אבל ההגייה מושפעת באופן בולט. נטלי אמנם הוגה את הרי"ש שלה בסדר, אבל הת"ו מחוככת למדי, הלמ"ד לועית מדי וכמה מהמילים זרות לה בבירור. כך למשל היא מבטאת את המילה "ענבר" עם בי"ת רפה ואת המילה "דגן" יותר כמו "צגן".

הנה המילים לשיר באנגלית, ואתם מוזמנים לנסות לפענח את התרגום בעצמכם (תיכף ניתן את הפתרון). בחיפושיי מצאתי גירסה יפה בעברית לבית הראשון, מאת אדם בשם יורם קולרשטיין (דרך הפוסט המושקע כאן):

יפֵהפִיָה ללא גבולות
וּזְהב דגן גלִי
הרים סגוּלים סְפוּגים בְּהוֹד
מישור עמוּס בִּפְרי
אמריקה אַת אֶרץ
שהאל בּרֵךְ בלי סוף
וּבְרית אחים נאמנה
תִשְׂרוֹר מחוף אל חוף.

אם כן, את הבית הראשון בן לי ואני ניסינו להבין בזריזות, אבל נתקענו קצת לקראת הסוף:

הו יפת שמים רחבים O beautiful for spacious skies,
וגלי ענבר דגן For amber waves of grain,
הדר הרים סגולים For purple mountain majesties
מעל שדה ??? Above the fruited plain!

גם הילדה ששרה במנדרינית, למשל, מבטאת לא נכון כמה עיצורים. הילדה ששרה בערבית מבטאת את המילים בסדר, אבל לרוע המזל המשקל של השיר מתנגש חזיתית עם התרגום מרובה-ההברות לערבית. כור היתוך.

Read Full Post »

אולי שמו לנו משהו במים אבל לאחרונה מתפרסמים כמה טורים טובים למדי על שפה. הזכרנו לא מזמן את השפעת השפה הרפואית על התודעה, ואך לפני כמה ימים הופיע טור של על הוראת הלשון בבתי הספר. אבל בניגוד להגיון הפובליציסטי הבריא (לפיו מספיק לרדת על הילדים-של-ימינו שלא יודעים מה ההבדל בין מפיק לדגש בשביל לזכות במאות טוקבקים אוהדים), רינה ברוך מביאה משב רוח רענן לדיון על מצב לימוד העברית (זעקת המורה ללשון, הארץ, 21/4/2013):

אילו התבקשתי לתאר את הבעיה על רגל אחת, הייתי אומרת כך: עומד לו המורה ללשון בכיתה ואומר לתלמידיו "שווא בראש המלה הוא שווא נע", ואת המלה "שווא" הוא מבטא פעמיים בשווא נח בראש המלה. וזאת מפני שתורת ההגה והצורות של העברית התִּקנית, הרִשמית, זו הנלמדת בשיעורי הלשון בבית הספר […] היא תורת ההגה והצורות של עברית המקרא […] ולא תורת ההגה והצורות של העברית שלנו, העברית הישראלית.

ויש המשך:

כלל נוסף מכללי הדקדוק הנלמדים בבית הספר: "צורת בינוני יחידה של פעלי ל"ה היא מלרעית: רָצָה, קָמָה בָּאָה וכו'. עוד שקר. הרי איש איננו מדבר כך, ואיש אינו קורא כך טקסט כתוב, גם לא המורה ללשון.

במילים אחרות, איך ניתן לדרוש מהתלמיד להתייחס לכללי השווא הנע בתור כללים אמיתיים, כשאנחנו בעצמנו אומרים shva ולא sheva.

ברוך מתארת יפה את חוקי ההגייה של העברית המודרנית, שלא יהיה ספק שמדובר במערכת שיטתית וקבועה. היא גם מצביעה יפה מאוד על ההבדל בין הכתיב וההגייה של העברית והמצב בשפה דוגמת אנגלית:

נכון שגם בלשונות אחרות הכתיב מייצג הגייה שכבר עברה מן העולם. באנגלית המלה knife (סכין), למשל, נהגית בלי העיצור k ובכל זאת כותבים בראש המלה את האות המייצגת אותו. אבל בניגוד לעברית, קרייני החדשות ברדיו ובטלוויזיה לא יהגו את המלה הזאת בצורתה העתיקה, ומשרד החינוך לא יכלול את הצורה העתיקה ב"תיקוני ההגייה" בחומר של בחינות הבגרות. הם מכירים בעובדה שה-k הזאת כבר מתה, והם נותנים לה לנוח על משכבה בשלום.

אין לי הרבה מה להוסיף על הטור הזה, בין היתר מפני שדברים דומים כבר נאמרו כאן (ואצל ידידינו) לא פעם. קריאה מומלצת ביותר.

Read Full Post »

שלומי התפרץ לאחרונה לדלת פתוחה אך כאובה, כשהפנה את תשומת לבי לפרסומת של רשת מוצרי הבית הום סנטר. שופופו.

מקווה שבמיוחד שפפתם את המכתם הבא (0:12): "וּבַעַל, כַּפָּרָה עליו, שדואג למצרכים". זעקי ארץ. כל העממיות המעושה עפה מהחלון עת ג'קי אזולאי (מתהילת מרא דמטבחא) מואלצת לשמור על הגיית ו"ו החיבור בשורוק בסמיכות לאות בומ"פ, תוך שמיטת הדגש ב-ב'. ועוד במרחק מילה מ-"כפרה" מלעילי במופגן.

לא שזה חדש. מפגעים שכאלה פוקדים את מחוזותינו חדשות לבקרים. אני לא לגמרי סגור על כללי הברודקאסט, אבל אני חושב שיש איזו מחויבות כמעט-חוקית של פרסומות לציית לכללי הלשון לפי הנחיית עורכים לשוניים (וראו את התרגומים הקטנים שמופיעים כל אימת שנאמרת מילה לועזית בפרסומת, גם אם הגרסה הזרה מוכרת בהרבה מתרגום האקדמיה האזוטרי). קדימה, יש פה מספיק קוראים מעולמות התקשורת והעריכה הלשונית. האירו את עינינו בתגובות.

אז אני מציע להלן את הכינוי עריכה קלשונית, יען כי היא דוקרת את גוף הפרסומת ומוציאה ממנה הרבה מאוד מהתוכן. אבל דווקא לא פרשת הום סנטר יזמה את הרשומה הזו, אלא תשדיר רדיו של גלגלצ (יובל תזמן שלוש תמיהות, תודה יובל), המפציר בהורים לדאוג שילדיהם לא יעשו שטויות באוספם קרשים לאירוע היחיד בעולם שבו חוגגים אסון לאומי קולוסאלי. אבל לא מגניבים כגלגלצ (בשיתוף משרד התחבורה, הרשות הלאומית לבטיחות בדרכים) ישתמשו בפועל "להפציר". לא לא, אומרת הקריינית.

תַּחְפְּרוּ להם.

עכשיו, כאן יש אבסורד קטן כבר ברמת המילה הבודדת. אף אחד לא שומר על בגדכפ"ת בהטיות הפעל מהשורש ח-פ-ר, לפחות לא בהוראתו כ-"לדבר הרבה על נושא ממוקד תוך הסבת שעמום לשומעים". אבל הקריינית מקולשנת, ולמאזין יירע.

אלא מאי? שיש פתרון לצרימה, והוא לתקן את המשפט! כן, כן! בעברית תקנית, מה שצריך לבוא כאן הוא צורת ציווי. וראו זה פלא – "חִפְרוּ להם" שומר על הבגדכפ"ת כמו שאנחנו אוהבים. אז מה היה לנו כאן? מעין "קלשון פיפיות". רצו עברית תקנית וזורמת וקיבלו עברית לא תקנית וצורמת. יצאו קירחים מכאן ומכאן. גם אכלו את הדג המסריח וגם גורשו מהעיר. אני מקווה שלפחות הסתכלו היטב לשני הצדדים לפני החציה. נו, של הכביש. ביציאה מהעיר.

[תודה, שלומי]

Read Full Post »

מנהג קבוע הוא בבלוגנו להתלונן על כותבים עצלנים שמאשימים את השפה בכל חוליי החברה, כאילו השימוש במילה כזו או אחרת מטַפֵּש את הנוער או מצביע על הידרדרותנו המוסרית או מה שזה לא יהיה. ביד חזקה ובזרוע נטויה נזעקנו להגיב ולתקן, להסביר שצריך גם למצוא קשר בין סיבה ותוצאה, שזכותו של כל אחד לא לאהוב מילה מסוימת אבל שאי אפשר להכליל מכך על איזושהי תופעה חברתית מעורפלת.

אבל זה לא אומר שאין קשר בין שפה ותודעה, כפי שציינו בעצמנו. ד"ר עופר כרמי, למשל, כותב כך בבלוג של קופת חולים כללית על ההבדל ביחס שלנו לסרטן ולסוכרת:

שימו לב לרגשות שעולים כשאנחנו קוראים את המילה "סרטן". המעיים מתהפכים, נכון? רק מעצם אזכור המילה עולות במוחנו אסוציאציות איומות: מוות, סכנה, פחד וסבל. אבל האם באמת הסרטן שונה ממחלות מסכנות חיים אחרות? כל כך הורגלנו לחשוב שכן. כשמאבחנים אצל מישהו את ה"מחלה" (שפעמים רבות עדיין מקובל לא להזכיר את שמה המפורש, מפחד, שמא, ופן, וחלילה…) הוא מיד מתויג בתעודת הזהות הפסיכולוגית שלו ושל סביבתו כחולה שחייו נעצרו באחת. לכן על כולם להתגייס ל"מלחמה", שהרי כולנו כבר הורגלנו להכיר את האגודה למלחמה בסרטן.

אבל האם זה חייב להיות כך? ודאי שלא. זה הכול עניין של התניות תרבותיות.

לעומת זאת, חישבו כיצד אנחנו מתייחסים לסוכרת, למשל. בדרך כלל לא מבריאים מסוכרת, ומסרטן ניתן להבריא בשיעורים הולכים וגדלים. […] האם שמעתם פעם על "מלחמה בסוכרת" או על תיוגו של החולה בסוכרת מבחינה חברתית כ"חולה"? האם שמעתם פעם על "מחלים סוכרת"? לא ולא. אבל על "מחלים סרטן"? כן וכן. מדוע?

אין לי נתונים על הקשר בין אופטימיות וגישה חיוביות להבראה ממחלה, אבל חוכמת אנשים מלומדה היא שיש מתאם בין השניים ושגישה חיובית לתהליך ההחלמה אכן עוזרת. שוב – אני לא מכיר את המדע מאחורי הטענה הזה. כרמי ממשיך:

עולם המושגים שיצרנו סביב מחלת הסרטן פוגע בנו במקום לשרת אותנו. לקבוצת התרופות נוגדות הסרטן אנחנו קוראים "כימותרפיה", אף ששום תועלת לא צומחת מעצם השימוש במילה או מהזכרתה. נהפוך הוא. רק פחד וסבל. תארו לעצמכם שבכל פעם שהיינו רושמים אנטיביוטיקה לתינוק ורוד לחיים שחלה בדלקת אוזניים היינו אומרים לאם שאנו רושמים לו  תרופה נוגדת (אנטי) חיים (ביו). ברור שהיינו משתגעים.

מה הפלא אם כן, שהחולים חווים "תופעות לוואי" קשות? הבחילות וההקאות המפורסמות שאנשים מכירים בהקשר לטיפול הכימי (וכיום יש בידינו תרופות וטיפולים משלימים רבים המקטינים מאוד את שיעור הבחילות וההקאות ואת חומרתן), מתויגות ומוצגות כ"תופעות לוואי" שליליות המדכאות את מצב רוחו של "החולה", בעוד שהלכה למעשה הן ביטוי של חוכמת הגוף לריפוי!

כל בעל חיים, כולל האדם, שנחשף לרעל (והתרופות הכימותרפיות הן בסופו של דבר, רובן ככולן, רעלים) מנסה להיפטר מהרעל באמצעות הוצאתו מהגוף. זאת ועוד, ידוע שבחלק מהמטופלים בכימותרפיה, הבחילות וההקאות הן עניין של צפייה והתניה שלילית נלמדת.

[…]

גם תשישות, כמה שלא נעימה, היא לפחות אצל חלק מהמטופלים, בשלבים מסוימים, עדות לתבונת הגוף ולצורך שלו במנוחה בעודו טורח על שיקומו. אלא שמנוחה היא דבר שלא בא לבריות בחברה שלנו בקלות. קשה לאנשים להיכנע לתשישות. כשהם מגלים שאינם מסוגלים להתרוצץ כתמיד, הם מתנגדים לצורך להאט וחווים את התשישות כ"תופעת לוואי" שלילית, במקום להקשיב לגופם הזקוק לקצב החלמה אחר כביטוי לתבונת הריפוי שלו.

החיים והמוות, אם כן, ביד הלשון והתודעה.

אני לא יודע עד כמה כרמי מגזים לצורך הבעת המסר שלו, אבל הטענה הגיונית לטעמי: אוצר המילים שקשור לסרטן שונה מאוצר המילים המקובל לסוכרת, ועומד בסתירה ליחס בין סיכויי ההחלמה משתי המחלות. כמובן שצריך להתחשב גם בסבל היום-יומי שהמחלות השונות גורמות, אבל אין ספק שכחברה אנחנו מתייחסים לשתיהן באופן שונה מהותית. בנוסף, אם בחילות והקאות במהלך טיפול כמותרפי הן לפחות בחלקן תוצאה של התניה שלילית, הטענה של כרמי מקבל משנה תוקף.

נכון שכמו בטורים שסקרנו בעבר, גם כאן אין מספרים או נתונים אלא רק הערכות שבודה הכותב מליבו. אבל הפעם, בהתחשב בכך שהמציג הינו רופא ובכך שהקישור הלוגי בין הסיבה והתוצאה נראה לי יציב, יש כאן דוגמה טובה לכך שהשפה אכן עשויה להשפיע על התודעה – ואיתה, על הגוף.

Read Full Post »

לקח לי זמן עד שהאזנתי לנאום הבכורה של ח"כ מרב מיכאלי בכנסת, אבל טוב שעשיתי זאת משתי סיבות. הראשונה: מדובר בנאום מעולה ואני ממליץ לצפות בו בזמנכם הפנוי. השנייה: הוא עונה על שאלה ששאלתי את עצמי בעבר, והיא כיצד מדברים בעברית על privilege.

הכי קל להסביר את הכוונה באמצעות דוגמה. לא עוברות 20 שניות ומיכאלי מתארת את המקום שממנו נובעת הביקורתיות שלה: "המקום שבו מצד אחד אני חלק משושלת מייסדת, אבל מצד שני אני אישה. אמנם אישה פריבילגית, אמנם אישה שהיא הנכדה-של, אבל אישה." כלומר מיכאלי מודעת לזכויות-היתר שיש לה, אבל טוענת שהן לא צריכות להסיח את הדעת ממהות דבריה.

בשיח הליברלי/פמיניסטי המילה privilege משמשת לתיאור זכויות-היתר ששכבות מסוימות באוכלוסיה מקבלות, לרוב בכוונה לגברים לבנים [דוגמה]. בישראל השימוש במושג הזה נפוץ פחות, להתרשמותי, מסיבות שמעניין מאוד לדון בהן אבל לא על דפי בלוג זה. על כל פנים, תהיתי בעבר מה המונח בעברית, והנה מצאתי.

אני לא יודע אם בחוגים אחרים משתמשים במונח אחר אבל זה כנראה המונח המועדף על מיכאלי, משום שהיא משתמשת בו פעמיים נוספות: "לקחת אחריות על המקום הפריבילגי" (6:13), "המקום החזק והפריבילגי שלה" (6:55).

Read Full Post »

Older Posts »