?מה ההבדל בין סריקת ספרים לסריקת מסמכים

סריקת ספר לקובץ PDF

הדרך הטובה ביותר ללמוד כיצד לסרוק ספר היא להבין שסריקת ספר שונה מסוגים אחרים של סריקה. קיימים מספר הבדלים מהותיים בין סריקת מסמכים לסריקת ספרים: 

עובי העמודים – בדרך כלל לספרים יש דפים עבים בהרבה מעובי של מסמכים. לפעמים העובי שלהם לא מאפשר לסרוק אותם בסורק מסמכים עם מזין נייר. מצד שני, קטלוגים או מגזינים, עשויים מדפים רגישים שכאשר הם נכנסים לסורק עם מזין נייר אוטומטי, הם מתקפלים ונתקעים.

דפים מעוגלים – ספרים ניתן לחלק לשני סוגים: אלה שהדפים שלהם שטוחים ואלה שלא. אם רוצים לסרוק ספר בסורק עם משטח סריקה, ללא פירוק הדפים שלו, מגלים שבחלק הפנימי של העמודים קיימת גבעה, ואם הספר לא שטוח ומוצמד למשטח הסריקה (ולפעמים גם אם הוא כן), מקבלים כתמים שחורים בקו התפר שבין העמודים.

ספרים אלה יכולים בקלות להיסרק אם מפרקים להם את הכריכה, חותכים את הדפים בגליוטינה, וסורקים אותם בסורק עם מזין נייר אוטומטי שמותאם לעובי הדפים. סריקת דפים בודדים בסורק עם מזין נייר אוטומטי לא מצריכה הרמה של משטח הסריקה בכל פעם, העברת עמוד, סגירת המשטח, לחיצה פיזית על המשטח ולחיצה על כפתור הסריקה.

דפים חצי שקופים – אם אתה רוצה לבצע שימוש בתוכנה לזיהוי טקסט (OCR) שמאפשרת ליצור קובץ וורד לצורך עריכה מחודשת, מומלץ לסרוק ברזולוציה גבוהה כדי לקבל את האיכות הטובה ביותר של תמונה בשחור לבן.  הבעיה עם הגדרה זו היא שכאשר אתה סורק דף של נייר דק, הסורק יקלוט את הפרטים שיש על הצד האחורי של הדף.

יש דרך פשוטה להימנע מבעיה זו. לשים נייר שחור מאחורי הדף שאתה סורק ואז הבעיה תיעלם מיד. למרבה הצער, את התרגיל הזה קשה לעשות בסריקה עם סורק המכיל מזין נייר אוטומטי. מה שאפשר לעשות זה לשים נייר דבק שחור על המצלמה התחתונה של הסורק ולסרוק את הדפים דף אחד בכל פעם. בסופו של דבר הדרך הטובה ביותר לסרוק דפים חצי שקופים היא בסורק עם משטח סריקה, דף אחד בכל פעם.

 תמונות וגרפיקהכשיש צורך לבצע  OCR על הטקסט שתסרקו, מומלץ תמיד לסרוק בשחור לבן. הבעיה שתמונות וגרפיקה צריכים להיסרק בצבע. פתרון פשוט זה כדי להתחשב בהגדרות רק בטקסט תוך התעלמות מהתמונות. הדרך לעשות זאת היא לסרוק את העמודים עם הגרפיקה באופן נפרד בהגדרות שונות ובסריקה צבעונית, ולהוסיף אותם בתום התהליך, באופן ידני,  לקובץ הסריקה המקורי.

זיהוי טקסט מוצלח – הדרך הטובה ביותר לוודא שהטקסט יעבור תהליך זיהוי מוצלח בתוכנת ה- OCR, ועם מינימום שגיאות, היא סריקה באיכות הגבוהה ביותר. דרך נוספת היא  לסרוק מתוך תוכנת  ה- OCR ותוך כדי מעקב לוודא שכל דף של טקסט סרוק זהה או דומה לטקסט המקורי. הסיבה לעשות את זה בזמן הסריקה היא שניתן לראות תמונה של הסריקה המקורית יחד עם הטקסט שחולץ מהדף הסרוק, לוודא שיש תאימות, ולתקן שגיאות שנמצאו.

מספרי עמודים וכותרות – בדפי ספר יש בדרך כלל כותרות עליונות ותחתונות בעמודים. כותרות אלו כדאי להסיר כשעושים OCR במידה ובטסט שעשיתם גיליתם שהם לא מזוהים כראוי. הדרך הטובה ביותר לעשות זאת היא להגדיר בתוכנה שלא לזהות אותם מלכתחילה. לאחר שתהליךהזיהוי מסתיים ומקבלים קובץ וורד ניתן להוסיף ידנית בהגדרות התוכנה את הכותרות שירוצו בכל העמודים.  

זקוק להצעת מחיר לסריקת ספרים
חייג 054-5880060

Comments are closed.