Feeds:
פוסטים
תגובות

Archive for the ‘יידיש’ Category

בעיתות משבר סטודנטיאליות, שנופלות לרוב על תקופות מבחנים, טוב שיש היסטוריה מפוארת של בלשנים עליה ניתן להישען. לאחרונה נזכרתי באוריאל ויינרייך, חוקר יידישאי, מחלוצי חקר הדו-לשוניות וסמנטיקאי כל כך מהפכני שאין לי מושג מה הוא עשה בסמנטיקה.

יידיש. ויינרייך היה אחד מגדולי חוקרי ומתעדי היידיש של המאה העשרים. הוא היה בלשן שעסק בחקר ותיעוד השפה בדרכים שונות, אבל התרומה הגדולה ביותר שלו היתה המילון. המילון היידי-אנגלי/אנגלי-יידי המודרני שלו נחשב עד היום לפסגת התיעוד הלשוני של השפה. דרור ברורשטיין כתב עליו יפה, בהתפעלות וביראת-קודש, לפני כמה שנים.

דו-לשוניות. בד בבד עם עיסוקו ביידיש, ויינרייך היה מחלוצי ההסתכלות המדעית על דו-לשוניות (בילינגוואליזם). בעוד בתקופתו (החצי הראשון של המאה העשרים) עדיין היה נפוצה התפישה לפיה למידת שתי שפות או יותר, יש בה כדי להשפיע לרעה על יכולותיו השכליות, ויינרייך היה חלק מגל של חוקרים שהחל להסתכל על דו-לשוניות כתופעה מעניינת בפני עצמה. כמובן שהוא לא היה חף מטעויות אופייניות לזמנו (למשל ההכרזה על כך שדובר אמיתי של שתי שפות לעולם לא משתמש בשתי השפות באותו משפט) אבל חלקים גדולים מכתביו רלוונטים גם היום.

סמנטיקה. למרבה המבוכה, אני לא מתמצא בעבודתו הסמנטית של ויינרייך. הוא פרסם ספר או שניים, את זה אני יודע (Explorations in Semantic Theory), אבל בנושא הזה אצטרך לפנות לקוראינו הסמנטיקאים ולהתייעץ בהם. סמנטיקאים, ראו עצמכם יעוּצים.

מקס ויינרייך. אביו של אוריאל ויינרייך, מקס, היה כמו אוריאל ויינרייך רק עם צבא וחיל ים. וליתר דיור, לויינרייך האב מיוחסת המימרה לפיה "שפה היא דיאלקט עם צבא וחיל ים", גם אם לא ברור אם הוא חשב על אמרת השפר הזו בעצמו או שהיא נאמרה על ידי מאזין באחת מהרצאותיו. גם מקס ויינרייך היה חוקר יידיש, ובוויקיפדיה ישמחו לספר לכם על פועלו הציוני.

Read Full Post »

נישאים על גלי ההדף של אירוע יומולדת לדורבנות, רוביק רוזנטל וגלעד צוקרמן ממשיכים להִדיין, כשהפעם האכסניה היא הבלוג של ידידתנו תמר עילם גינדין. צוקרמן קיבל אכסניה לפרט את התיאוריה ההיברידית שלו, ואני נחפזתי להגיב לכל פוסט-אורח שלו שם, משום שאני עצלן מכדי לעשות את זה כאן שלא רציני לקטול את התיאוריה שלו בבלוג שלי מבלי שקראתי את הספר עצמו מהתחלה ועד הסוף. למרבה המזל, אצל תע"ג יש לצוקרמן הזדמנות למחזר את מיטב טוריו ומאמריו ואפשר להגיב לכל נקודה ונקודה. הנה הפוסט הראשון, על דוברים ילידים (שעם רובו אני מסכים), והנה הפוסט השני, על מורפולוגיה (שעל רובו אני חולק).

Read Full Post »

מערכת תרגום המכונה המרשימה של גוגל, Google Translate, הוסיפה היום 9 שפות, ביניהן סוואהילי ויידיש.

יידיש! ניתן לתרגם אוטומטית מיידיש! עורו, יהודים, עורו! יידישע איבערזעצונג!

jewgle0909

ועכשיו קצת יותר ברצינות: מערכת התרגום של גוגל עובדת לפי העיקרון של תרגום מכונה סטטיסטי. מזינים למערכת קורפוס מקביל, כלומר טקסט בשפה אחת ואת איך שהוא כבר תורגם לשפה אחרת, והיא "לומדת" איזו מילה מיתּרגמת לאיזו מילה, איך סדר המילים בשתי השפות שונה, וכן הלאה. אם לגוגל (או לכל אחד אחר!) יש למשל שלל סיפורים ביידיש ואת התרגומים שלהם לאנגלית, הם יכולים ליצור מהקורפוס הזה מערכת לתרגום מכונה יידיש-אנגלית. אין צורך בהתאמות גדולות מדי משפה לשפה, רק צריך המון מידע, ואת זה יש לגוגל בשפע. לעוד על תרגום מכונה יש כמה פוסטים מעניינים אצל אורן צור במדע בזיוני (אלא מה) ומטיבי לכת יכולים להסתכל על האתר שמתחזק פיליפ קוהן מאוניברסיטת אדינברו, אחד החוקרים הבולטים בתחום היום. תרגום מכונה הוא אולי התחום הבולט, הפופולרי והמתוקצב ביותר בעולם הבלשנות החישובית, ובהחלט יש אפשרויות לעשות בזה דברים יפים גם בארץ.

מה שרציתי להגיד הוא שקל מאוד לצחוק על תרגומים שגויים של מערכות תרגום מכונה, וגם עושים את זה הרבה מאוד. אבל להתלונן על תרגום רחוק ממושלם מפספס את הנקודה: אנחנו גם ככה לא יכולים ליצור תרגום מושלם באופן אוטומטי. אבל מהיום אנחנו יכולים לתרגם אוטומטית את הערך בוויקיפדיה ביידיש על גפילטע פיש ולראות ישר מה ההבדל בין גפילטע פיש פולני וגפילטע פיש ליטאי. באותה מידה אנחנו יכולים גם לקרוא כתבה מעיתון נורבגי ולהבין אותה לא רע. כתבה מעיתון נורבגי! זה כמו קסם.

אז בבקשה, נישט קיין שפאס טרייבען מיט דער איבערזעצונג. ולא, לא אמרתי הרגע "לא להקיא לדחוף".

Read Full Post »

« Newer Posts