המילון ההיסטורי ללשון העברית הוא מפעל מחקרי רחב היקף של האקדמיה ללשון העברית, שמטרתו להעמיד מילון מדעי ללשון העברית על כל רבדיה ההיסטוריים, מן העת העתיקה ועד לעת החדשה. על הקמת המפעל החליט האקדמיה ללשון עברית עם הקמתה בשנות החמישים של המאה שעברה. העבודה על מפעל המילון החלה בשנת 1959.
מטרתו של מילון היסטורי למסור את תולדותיהן של המילים בשפה: משמעויותיהן במהלך הדורות וגלגולי צורתן; מתי תועדו לראשונה ומתי פסק השימוש בהן.
מפעל המילון ההיסטורי הוא מפעל לאומי, תרבותי ומדעי שיעמוד לדורות, והוא מהראשונים מסוגו בעולם שהקים מאגר אלפביתי ממוחשב. המאגר מקיף היום למעלה מאלפיים שנות כתיבה עברית, ויש בו אלפי חיבורים מן התקופה שמן המאה השנייה לפני הספירה ועד למאה האחת עשרה לספירה.
בחירת מאגר הנתונים
השלב הראשון בהכנת המילון היה בחירת היצירות שמהן יישאב החומר למילון. לצד היצירות החשובות מבחינת השפעתן על האומה (מקרא, משנה, תלמוד, מדרש) נקבע כי המקורות למילון יכללו גם יצירות הנותנות ייצוג לתקופות שונות ולמקומות גאוגרפיים שונים, אף אם חשיבותן הספרותית אינה רבה. כמו כן נכללו חיבורי הקראים, ונראה שאף חיבורי השומרונים עתידים להיכלל בין המקורות.
היות שמדובר במקורות רבים מאוד, החליט בן חיים להתמקד במקורות העת העתיקה: מחתימת המקרא ועד סוף תקופת הגאונים. הוחלט שלא לכלול את המקרא בין מקורות אלו, משום שהחומר המקראי נתון לחוקרים בקונקורדנציות ובמילונים טובים, וניתן בקלות לשאוב אותו משם.
עם המקורות למילון ניתן למנות את: החומר האפיגרפי הקדום (חרסי לכיש, מגילות מדבר יהודה, תעודות נחל חבר), המשנה (על פי כתב יד קאופמן), התלמוד הבבלי (על פי כתבי יד תימניים), התלמוד הירושלמי (על פי כתב יד ליידן), מדרשי הלכה ומדרשי אגדה.
הקמת מסד הנתונים
השלב השני בהכנת המילון היה הכנת התשתית הטקסטואלית לצורך ליקוט חומר הגלם למילון. כל המקורות הספרותיים שנקבעו כבסיס למילון הועתקו למסד נתונים ממוחשב על פי כתב היד הטוב ביותר שלהם. עובדי המילון עברו על כל מילה במסד הנתונים ותייגו אותה לערך המילונאי שאליה היא משתייכת. בצורה זו הלכה ונוצרה קונקורדנציה רחבת היקף של כל המקורות העבריים הנכללים במאגר, ועובד המילון יכול היה לשלוף, תוך שניות בודדות, את כל המשפטים שבהם מופיעה מילה מסוימת בכל המקורות שהועלו למסד הנתונים.
ב-1969 הוקם המדור לספרות חדשה במילון. המדור מעלה ומנתח טקסטים מ-1750 ואילך. 600 חיבורים נבחרו להיכנס למאגר ובהם טקסטים של ביאליק, עגנון, אחד העם וז'בוטינסקי הוכנסו. כך נוצר מעין פער של 700 שנה בין 1050 ל-1750 ועתה משקיעים אנשי המילון מאמץ בסגירת הפער.
בשנת 1992 הוחלט לפתוח את מסד הנתונים, שעד כה היה זמין לעובדי המילון בלבד, לציבור הרחב. מספר שנים מאוחר יותר (1998) יצא תקליטור הכולל את מסד הנתונים הממוחשב של התקופה העתיקה וכן תוכנה לחיפוש. תקליטור זה כונה "מאגרים".
מספר שנים מאוחר יותר, ועקב הצורך המתמיד לעדכן את מסד הנתונים, הוחלט לעבור לשיטה מקוונת. בשנת 2005, לאחר תקופת ניסיון קצרה, הועלה מסד הנתונים לאתר האינטרנט של האקדמיה ללשון העברית, ושמו - כשם התקליטור - "מאגרים". הגרסה המקוונת של "מאגרים" נחנכה באופן רשמי ב־19 ביוני 2006.
העבודה על מסד הנתונים נמשכת באופן מתמיד, הן בשל הצורך לעדכן את המסד על פי התקדמות המחקר, והן משום שמעת לעת מתגלים חיבורים עתיקים נוספים.
הגרסה המקוונת של "מאגרים"
בשנת תשס"ו (2006) פרסמה האקדמיה ללשון העברית באתר מאגרים את כל החומר הטקסטואלי של הספרות העתיקה שנאסף במפעל המילון ההיסטורי כפי שהוכן לצורכי המפעל. הארכיון האמור של מפעל המילון אינו ארכיון של מילים בלבד אלא גם ארכיון של טקסטים - מועתקים על פי כתבי היד הטובים ביותר, מנותחים ומעובדים על פי עקרונות מדעיים מובהקים.
העמדתם המדויקת של הטקסטים פתחה אופקים חדשים לפני העוסקים בספרות חז"ל, ובפעם הראשונה התאפשר לקהל המשכיל עיון בפרקי יצירה יהודית שהיו חבויים לפני כן בספריות מרוחקות בארצות העולם, בהם יצירות פיוט ותפילה שנעלמו מעבודת בית הכנסת זה דורות ונקלטו בארכיון המילון ההיסטורי ועומדים לרשות כל אדם באתר האקדמיה באינטרנט.
מפעל המילון ההיסטורי לשפה העברית הוא התרומה החשובה ביותר של האקדמיה ללשון העברית למדינת ישראל, והוא מהראשונים מסוגו בעולם שהקים מאגר אלפביתי ממוחשב. כך בפעם הראשונה מוצע לפתוח בפני הקהל הרחב גישה בפרקי היצירה היהודית והעברית שהייתה חסומה בפניהם עד כה.
על פרויקט המילון ההיסטורי של ״ציוני דרך״
עד לא מזמן כלל המאגר את הספרות העתיקה בלבד (זו שנכתבה עד לשנת 1050), והיה פתוח לחוקרים ולמנויים בלבד.
במסגרת פרויקט ציוני דרך נפתח האתר לציבור הרחב ללא כל תשלום. כמו כן ניתנה תמיכה להמשך פיתוח המפעל, איסוף הנתונים וכתיבת הערכים.
חוקרים, תלמידים מתקדמים והציבור הרחב משתמשים יותר ויותר באוצרות הגנוזים של הטקסטים העבריים הקדומים שעכשיו אפשר להגיע אליהם בלא טורח. זו מהפכה במחקר הטקסטים של היהדות הקדומה. פרסומם המתוכנן של הטקסטים העבריים מראשית ימי ההשכלה ועד אמצע המאה העשרים באתר האקדמיה יצר פתח למהפכה דומה במחקר הספרות העברית החדשה ולשונה.
פרטים על האתר:
כתובת האתר:
http://hebrew-treasures.huji.ac.il/
* מומלץ להיכנס לתיקיית ״הדרכה״ באתר, ולקרוא את ההנחיות המסבירות כיצד להשתמש באתר באופן הטוב ביותר.