ข้อมูลทางประวัติศาสตร์ ศิลปวัฒนธรรม ภูมิปัญญา รวมทั้งเอกสารหายากต่างๆ ถือเป็นมรดกอันล้ำค่าในการสืบสานความเป็นเอกลักษณ์ของประเทศ หากแต่ในปัจจุบัน ข้อมูลและองค์ความรู้เหล่านี้ยังคงบันทึกอยู่ในรูปแบบของเอกสารและหนังสือ ซึ่งสามารถเสื่อมสลายไปพร้อมกาลเวลา การรักษามรดกทางปัญญาของประเทศ ให้คงอยู่ ระบบการจัดเก็บและสะสมข้อมูล จึงต้องมีวิธีการจัดการที่สามารถแปลง ข้อมูลจากเอกสารต้นฉบับ มาสู่รูปแบบดิจิทัลที่สามารถเก็บรวบรวมข้อมูล ได้อย่างต่อเนื่อง และที่สำคัญครอบคลุมการเก็บรายละเอียดได้ครบถ้วน
และไม่ทำลายต้นฉบับเดิม

เนคเทคได้ร่วมกับกระทรวงวัฒนธรรม ในการแปลงและจัดเก็บหนังสือสำคัญของ หอสมุดแห่งชาติให้อยู่ในรูปดิจิทัล เพื่อให้ง่ายต่อการสืบค้นผ่านระบบเครือข่าย คอมพิวเตอร์ โดยได้พัฒนาขั้นตอนการแปลงข้อมูลที่เน้นความสำคัญกับการรักษา เอกสารต้นฉบับ เดิมที่มี การเก็บรักษามาอย่า่งยาวนานไม่ใ่ห้ถูก ทำลายไปด้วยการพัฒนา เครื่องสแกนเอกสารแบบตัววี (V-Shape Scanner) ดังรูปที่ 1 ที่สามารถรักษา และคงสภาพของหนังสือในขณะที่สแกนข้อมูลเข้าสู่ระบบคอมพิวเตอร์


01

รูปที่1 เครื่องสแกนเอกสารแบบตัววีโดยปกติ การสแกนหนังสือด้วยเครื่องสแกนเนอร์ ต้องอาศัยการวางหนังสือ ในแนวราบเพื่อให้ได้ภาพสแกนที่มีข้อมูลครบถ้วนทั่วทั้งหน้า วิธีดังกล่าวจะมีผล ต่อการสแกนหนังสือที่มีอายุยาวนาน ซึ่งอาจเกิดการชำรุดหรือขาดหายไปใน ระหว่างการสแกนได้ การพัฒนาเครื่องสแกนเอกสารแบบตัววี โดยหน่วยปฏิบัติการวิจัยเทคโนโลยีภาพ เนคเทค จึงเข้ามาช่วยรักษาและคงสภาพหนังสือเก่า ด้วยลักษณะการสแกนที่หนังสือแต่ละหน้าจะไม่ถูกดึงออกจากกันจนอาจเกิด
การชำรุดได้

นอกจากนี้ การสร้างระบบคลังข้อมูลดิจิทัลยังต้องอาศัยเทคโนโลยีรู้จำตัวอักษร (Optical Character Recognition: OCR) ที่ช่วยในการแปลงไฟล์ภาพเอกสารต่างๆ ที่ผ่านการสแกนมาเป็นไฟล์ข้อความที่ผู้ใช้สามารถแก้ไขข้อความได้ทีมวิจัยจาก หน่วยปฏิบัติการวิจัยเทคโนโลยีภาพจึงได้พัฒนาต่อยอดระบบ OCR ที่ปัจจุบัน มีการใช้ในเชิงพาณิชย์ภายใต้ชื่อซอฟต์แวร์อ่านไทย ซึ่งแม้มีความถูกต้อง ในการรู้จำตัวอักษรประมาณ 95 เปอร์เซ็นต์ แต่ซอฟต์แวร์ดังกล่าวยังไม่สามารถเรียนรู้ฟอนต์ใหม่ๆ ได้ด้วยตัวเอง เมื่อนำมาใช้แปลงไฟล์เอกสารที่มีฟอนต์แตกต่างจากที่ฝึกสอนไว้ อาจจะได้ผลการรู้จำไม่แม่นยำเท่าที่ควร


การพัฒนาจึงเป็นการสร้างระบบการรู้จำตัวอักษรภาษาไทยใหม่ที่มีความสามารถ ในการเรียนรู้ฟอนต์ หรือรูปแบบเอกสารใหม่ๆ ได้ เพื่อให้อัตราการรู้จำของเอกสาร มีความถูกต้องแม่นยำมากขึ้นในลักษณะที่เป็น Adaptive OCR เทคโนโลยีที่พัฒนาขึ้น ได้นำมาใช้แปลงและจัดเก็บเอกสารของหอสมุดแห่งชาติ เพื่อสร้างคลังข้อมูลดิจิทัล ปัจจุบันหอสมุดแห่งชาติได้ดำเนินการสแกนเอกสาร
ไปแล้วกว่า 800 เล่ม ซึ่งความร่วมมือครั้งนี้จะเป็นการนำเทคโนโลยีการรู้จำ ตัวอักษรแบบใหม่เข้ามาช่วยในการแปลงข้อมูลภาพที่ได้จากการสแกน เป็นไฟล์ ข้อความที่สามารถแก้ไขได้เพื่อนำมาพัฒนาเป็นระบบคลังข้อมูลต่อไป รวมทั้ง ใช้เทคโนโลยีเครื่องสแกนเอกสารแบบตัววีในการแปลงข้อมูลจากหนังสือและ เอกสารอื่นๆ เพิ่มเติมเข้าสู่ระบบต่อไป ขณะเดียวกัน หน่วยปฏิบัติการวิจัยเทคโนโลยีภาพ ยังได้นำเครื่องสแกนเอกสาร แบบตัววีและเทคโนโลยีการรู้จำตัวอักษรแบบใหม่มาใช้ในการจัดเก็บและ แปลงหนังสือหายากและหนังสือพิมพ์เก่าของประเทศสหภาพพม่า ซึ่งเก็บสะสม และรวบรวมโดย Mr.U Moe Myint นักธุรกิจชาวพม่า่ ดังรูปที่ 2 เพื่อพัฒนาเป็นระบบ คลังข้อมูลดิจิทัล นำขึ้นทูลเกล้าฯ ถวายสมเด็จพระเทพรัตนราชสุดาฯสยามบรมราชกุมารี02

รูปที่ 2 หนังสือหายากส่วนหนึ่งที่เก็บสะสม โดย Mr. U Moe Myint นักธุรกิจชาวพม่า่
และถูกจัดเก็บในรูปแบบดิจิทัลโดยใช้เครื่องสแกนเอกสารแบบตัววีโครงการดังกล่าว ได้เริ่มแปลงหนังสือหายาก จำนวน 224 รายการ รวมทั้งนิตยสาร วารสาร หนังสือพิมพ์ แบ่งเป็นชุดหนังสือพิมพ์เก่าจำนวน 21 เล่ม ชุด The Burma Digest จำนวน 32 เล่ม เพื่อสร้างเป็นระบบคลังข้อมูลที่รองรับการทำงานทั้ง Online และ Offline ในรูปแบบ Digital Library ที่สะดวกในการสืบค้น และเก็บรักษาข้อมูล อันเป็นประวัติศาสตร์อันยาวนานให้คงอยู่สืบไป

นอกจากนี้ เพ่อื ให้องค์ความร้ทู างด้านพุทธศาสนาดำรงอยู่ เนคเทคได้ร่วมกับมูลนิธิหอจดหมายเหตุพุทธทาส อินทปัญโญ จัดทำระบบคลังข้อมูลจดหมายเหตุดิจิทัล เพื่อเก็บรวบรวมข้อมูลเรื่องราวของท่านพุทธทาสอินทปัญโญ และคำสอนต่างๆ ให้สามารถสืบค้นได้ง่าย และมีประสิทธิภาพ

ทั้งนี้ การจัดเก็บข้อมูลเกี่ยวกับเอกสารจดหมายเหตุ โครงการได้นำซอฟต์แวร์ Imagemagick ซึ่งเป็นซอฟต์แวร์โอเพ่นซอร์สสำหรับอ่านและเขียนรูปภาพได้มากถึง 100 รูปแบบ (Format) และมีสัญญาอนุญาตให้ สาธารณชนใช้สิทธิในการใช้ซอฟต์แวร์ (General Public License) มาใช้เพื่อนำคำสอนต่างๆ ของท่านพุทธทาสที่มี การบันทึกไว้เป็นลายลักษณ์อักษรแปลงเข้าสู่ระบบดิจิทัล

เรื่องราวและเอกสารต้นฉบับของท่านพุทธทาส นับตั้งแต่ชีวประวัติ การเดินทางศึกษาธรรม การบรรยายธรรม การเผยแผ่ศาสนา บันทึกต่างๆ อาทิ บันทึกประจำวัน บันทึกการเดินทาง บันทึกธรรม ไปจนถึงงานประพันธ์ ทั้งร้อยแก้ว กวีนิพนธ์ งานแปล คำอวยพร คำกล่าว คำสัมภาษณ์ งานพิมพ์หนังสือทางด้านพุทธศาสนา และเรื่องราวสำคัญต่างๆ ได้มีการเก็บรวมรวบไว้ในระบบคลังข้อมูลเอกสารจดหมายเหตุพุทธทาส อินทปัญโญ เพื่อให้ประชาชนทั่วไปสามารถสืบค้นและเข้าถึง หลักธรรมคำสอน และเรื่องราวทางพุทธศาสนาต่างๆ ได้อย่างสะดวกและรวดเร็ว
นับเป็นการอนุรักษ์ (Digital Preservation) และขยายโอกาสในการเรียนรู้ เผยแพร่ และสืบทอดความรู้ทางด้านศาสนาในสังคมไทยอีกทางหนึ่ง

ข้อมูลทางประวัติศาสตร์ วัฒนธรรม รวมถึงพระธรรมคำสอนอันเป็นมรดกทางปัญญา อันล้ำค่าของชาติ จึงไม่ใช่เรื่องราวที่ห่างไกลอีกต่อไป เพราะภายใต้โครงการ Digitized Thailand องค์ความรู้ต่างๆ ที่นำไปสู่การพัฒนาทางปัญญาอย่างยั่งยืน จะสามารถเข้าถึงและสร้างสรรค์ให้เกิดขึ้นในสังคมไทยได้แค่เพียงปลายนิ้วสัมผัส....