หน้าแรกลงทะเบียนสมาชิกคลังข้อความไทย-อังกฤษคลังศัพท์ไทย-อังกฤษคลังเสียงพูดไทยคลังข้อมูลภาพตัวอักษรคลังรูปร่างสามมิติคนไทยคลังภาพจากกล้องจราจรคลังฐานข้อมูลจีโนมคลังข้อมูล Anomaly Detection
คลังข้อมูลภาพตัวอักษร

Thai OCR Corpus ฐานข้อมูลภาพสำหรับพัฒนาโปรแกรมรู้จำตัวอักษรภาษาไทย แบ่งเป็น

  1. ชุดฝึกฝน (Training set) ประกอบด้วยภาพอักษรภาษาไทยประเภท BMP จำนวน 162 ตัวอักษร แต่ละตัวอักษรมี 5,000 รูปแบบ รวมทั้งสิ้น 810,000 รูปแบบ
  2. ชุดทดสอบ (Test set) เป็นเป็นไฟล์ภาพเอกสารภาษาไทยประเภท JPG แบ่งเป็น 5 หมวด คือ หนังสือ หนังสือพิมพ์ วารสาร จดหมายราชการ และวารสารวิชาการ จำนวนหมวดละ 100 หน้า
สามารถดูรายละเอียดเพิ่มเติมที่ http://www.nectec.or.th/img/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ