ระบบสำรองข้อมูลราคาถูกโดยใช้ IDE Harddisk ฝ่ายวิจัยและพัฒนาสาขาคอมพิวเตอร์สมรรถนะสูง ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ คืออะไร ศูนย์เทคโนโลยีฯ ได้วิจัยและพัฒนาระบบคอมพิวเตอร์ที่ใช้อุปกรณ์พีซีที่หาได้ทั่วไปมาพัฒนาเป็นระบบคอมพิวเตอร์หลักเพื่อใช้งานด้านต่างๆ โดยเน้นที่ประสิทธิภาพสูงในราคาไม่แพงและอุปกรณ์หาได้ทั่วไป อีกทั้งพัฒนาบนซอฟต์แวร์เปิดเพื่อประหยัดเงินในการซื้อซอฟต์แวร์มาใช้ โดยระบบนี้เน้นไปที่การจัดเก็บข้อมูลขนาดใหญ่เพื่อนำมาใช้เป็นระบบจัดเก็บไฟล์ข้อมูล (File Server) และระบบสำรองข้อมูล (Backup Server) โดยระบบสำรองข้อมูลขนาดใหญ่นี้ใช้ IDE Harddisk ซึ่งราคาถูกและมีประสิทธิภาพสูงมาต่อรวมกัน ให้เสมือนเป็น Disk เดียวกัน โดยใช้ Software RAID (Redundant Array of Independent Disks) ทำให้มีความจุข้อมูลขนาดใหญ่ คุณสมบัติเด่น 1. นำมาประยุกต์ เพื่อใช้เป็นระบบจัดเก็บข้อมูลได้ เช่น Disk Storage , File Server , Backup System เป็นต้น 2. สามารถปรับเปลี่ยนเพื่อขยายการทำงานของอุปกรณ์ต่างๆ เพื่อเพิ่มประสิทธิภาพของระบบได้โดยง่าย เช่น Upgrade Harddisk , Network Card , CPU เป็นต้น 3. สามารถถอด Disk Storage เพื่อขยายพื้นที่เก็บข้อมูล และแยกเก็บข้อมูลไว้ในที่ที่ปลอดภัยได้ 4. อุปกรณ์ที่ใช้สามารถจัดซื้อง่าย และใช้เทคโนโลยีทางฮาร์ดแวร์และซอฟต์แวร์ซึ่งที่เป็นที่รู้จัก 5. ใช้เทคโนโลยีที่มีใช้โดยทั่วไป ผู้ใช้สามารถทำความเข้าใจระบบได้ง่าย และเป็นระบบที่มีการใช้งานอยู่ ทำให้สามารถพัฒนาระบบใหม่เพิ่มเข้าไปได้โดยง่าย ลักษณะการทำงาน ระบบที่จัดทำนี้ใช้ Harddisk ATA100 ขนาด 80 GB จำนวน 11 ตัว นำมาทำเป็น 10+1 RAID5 ได้ขนาดความจุข้อมูลรวม 800 GB จากการทดสอบความเร็วในการอ่านเขียนข้อมูลแบบ Block Sequential ไฟล์ขนาด 500 MB โดยใช้การทดสอบแบบ Bonnie พบว่าความเร็วในการอ่านข้อมูลเท่ากับ 29.63 MB/s การเขียนข้อมูลเท่ากับ 67.87 MB/s และทดสอบการรับส่งข้อมูลผ่านเครือข่ายคอมพิวเตอร์โดยใช้ 1000BaseT ได้ความเร็วในการรับส่งข้อมูล เท่ากับ 510.05 Mbps ระบบนี้สามารถนำไปใช้สำรองข้อมูลในระบบ Server ต่างๆ ได้ในราคาถูกและมีประสิทธิภาพสูง เมื่อเทียบกับการสำรองข้อมูลแบบอื่น นอกจากนี้ยังนำไปประยุกต์ใช้งานเป็น File Server และงานด้านต่างๆ ผ่านเครือข่ายคอมพิวเตอร์ได้ ในอนาคตจะได้พัฒนาให้สามารถรองรับการใช้งานที่หลากหลายมากยิ่งขึ้น เช่น การทำงานผ่าน XFS (eXtended File System) และ NFS (Network File System) หรือการใช้งานแบบ HOT Swap และ HOT Spare การนำไปใช้ ใช้เป็นระบบคอมพิวเตอร์หลักเพื่อรองรับงานเก็บข้อมูลขนาดใหญ่ (File Server) ทั้งในระบบ Linux และ MS Windows , ระบบ WebServer ระบบฐานข้อมูล หรือระบบสำรองข้อมูลทั้งต่อตรงผ่านเครือข่าย LAN หรือผ่านเครือข่าย Internet แนวการพัฒนาในระยะต่อไป 1. ศึกษาการใช้งานในแบบ HOT Swap และ HOT Spare 2. ขยายขนาดของระบบ โดยการเพิ่มจำนวนและขนาดของ HardDisk 3. ทดสอบการใช้งานจริงของ Multi User โดยพิจารณาถึง Reliability และ Stability 4. ศึกษาเพื่อหาแนวทางเพื่อเพิ่มประสิทธิภาพของการรับส่งข้อมูล 5. ทดสอบการทำงานผ่าน XFS(eXtended File System) และ NFS(Network File System) ผ่านการเชื่อมโยงแบบ Gigabit Ethernet บนสาย UTP Cat5E เพื่อให้เห็นเสมือนเป็น Disk เดียวกันระหว่างเครื่อง และขนาดไฟล์ 1 ไฟล์มากกว่า 2 GB คำอธิบายภาพ รูปที่ 1.แผนภาพแสดงการเชื่อมต่ออุปกรณ์ รูปที่ 2 Harddisk ATA100 ที่ใช้ขนาด 80 GB รูปที่ 3 การประกอบ Harddisk ลงใน Rack รูปที่ 4 Harddisk ประกอบใน RACK จำนวน 11 ตัว รวมความจุ 800 GB (10+1 RAID5) รูปที่ 5 การประกอบ Harddisk Rack เข้าใน Case รูปที่ 6 Case ของ Disk Storage (CASE EX-8) รูปที่ 7 Case ของ Server (CASE PC-62) รูปที่ 8 อุปกรณ์ภายใน Server (CASE PC-62) รูปที่ 9 อุปกรณ์ประกอบอื่นๆ ที่ใช้ รูปที่ 10 ระบบโดยรวมทั้งหมดหลังจากประกอบเสร็จแล้ว รูปที่ 11 โปรแกรมควบคุมการทำงานของ RAID และการใช้งาน รูปที่ 11 การติดตั้งและปรับแก้ค่าของโปรแกรมควบคุมการทำงานของ RAID เกร็ดความรู้ เรื่อง ฮาร์ดดิสก์ (Harddisk) from http://www.fortunecity.com/skyscraper/chaos/917/ ฮาร์ดดิสก์หรือมักจะมีชื่อเรียกอีกชื่อหนึ่งว่า ฟิกซ์ดิสก์ (Fixdisk) เป็นอุปกรณ์ที่ใช้ในการเก็บข้อมูลที่ได้รับการพัฒนาอย่างต่อเนื่อง จากในอดีตที่ฮาร์ดดิสก์ความจุเพียงแค่ 10 ถึง 20 เมกะไบต์ ที่มีขนาดรูปร่างที่ใหญ่โตเอาการประมาณ 5 นิ้ว มาจนถึงฮาร์ดดิสก์ที่มีความจุเป็นกิกะไบต์ แต่รูปร่างกลับเล็กลงจนเหลือขนาดเพียงแค่ 2.5 นิ้วเท่านั้น และราคาก็ลดลงจนสามารถหาซื้อโดยง่าย แท้จริงแล้วราคาของฮาร์ดดิสก์นั้นแทบจะเรียกได้ว่า ไม่ได้ลดลงเพียงแต่ได้ฮาร์ดดิสก์ที่มีความจุมากขึ้น ในราคาที่คงเดิม อินเทอร์เฟซของฮาร์ดดิสก์ อินเทอร์เฟซคือส่วนเชื่อมต่อของฮาร์ดดิสก์ที่จะต่อเชื่อมเข้าไปยังคอมพิวเตอร์อินเทอร์เฟซของฮาร์ดดิสก์ มีอยู่หลายชนิด แต่ชนิดที่นิยมใช้กันในปัจจุบัน ก็คือ E-IDE (Enhance IDE) และ SCSI (อ่านว่า สะ-กัส-ซี) E-IDE พัฒนาการขั้นต่อมาของ IDE E-IDE ได้รับการพัฒนาขึ้นมาจากพื้นฐานของ IDE ซึ่งจะปรับปรุงจุดด้อยและพัฒนาความสามารถของ IDE ขึ้นมาในอีกระดับหนึ่ง พัฒนาการสิ่งแรกที่เห็นได้อย่างชัดเจนก็คือ เรื่องของความจุฮาร์ดดิสก์แบบ IDE ไม่สามารถจะมีความจุได้เกิน 528 เมกะไบต์ แต่สำหรับฮาร์ดดิสก์แบบ E-IDE สามารถเพิ่มความจุได้มากถึง 8 กิกะไบต์ต่อไดรว์ และสิ่งที่สองก็คือ เรื่องของความเร็ว ฮาร์ดดิสก์แบบ E-IDE จะมีความเร็วในการถ่ายโอนข้อมูลที่ 11.1 เมกะไบต์ต่อวินาที ซึ่งถือว่าเป็นความเร็วที่สูงกว่า IDE มาก ทำให้มีผู้ที่นิยมนำไปใช้งานกันมาก เพราะเป็นฮาร์ดดิสก์ที่มีประสิทธิภาพสูง แต่ราคาต่ำ ฮาร์ดดิสก์ที่ดี ดูตรงไหน ? ในการพิจารณาถึงประสิทธิภาพของฮาร์ดดิสก์นั้น เราจะมีค่าที่ใช้วัดประสิทธิภาพอยู่สองอย่าง คือ เวลาในการเข้าถึงข้อมูล (Access time) และอัตราการถ่ายโอนข้อมูล (Data transfer rate) เวลาในการเข้าถึงข้อมูล (Access time) ฮาร์ดดิสก์ที่ใช้เวลาในการเข้าถึงข้อมูลน้อยที่สุด คือ ฮาร์ดดิสก์ที่มีความเร็วในการอ่านข้อมูลมากที่สุด หน่วยที่ใช้วัดเวลาในการเข้าถึงข้อมูลของฮาร์ดดิสก์คือมิลลิวินาที (MilliSecond-ms) ฮาร์ดดิสก์ที่ผลิตออกมาในรุ่นแรก ๆ จะใช้เวลาในการเข้าถึงข้อมูลสูงมาก คือ อยู่ในระดับ 100 ms เมื่อเทคโนโลยีของฮาร์ดดิสก์พัฒนาขึ้นเรื่อย ๆ เวลาที่ใช้ก็เริ่มลดน้อยลงไปจนปัจจุบันก็จะเหลือเพียงไม่เกิน 15 ms เท่านั้น แต่ถ้าต้องการฮาร์ดดิสก์ที่มีความเร็วสูงจริง ๆ ก็ไม่นาจะดูฮาร์ดดิสก์ที่มีความเร็วต่ำกว่า 10 ms แต่ค่าเฉลี่ยโดยทั่วไปก็จะอยู่ที่ 12-13 ms อัตราการถ่ายโอนข้อมูล (Data transfer rate) อัตราการถ่ายโอนข้อมูล ก็คือ เวลาที่เมื่อฮาร์ดดิสก์พบข้อมูลที่ต้องการแล้วจะใช้เวลาเท่าไรในการส่งข้อมูลไปยังหน่วยความจำ เราเรียกว่าอัตราการถ่ายโอนข้อมูล เช่นเดียวกับเวลาในการเข้าถึงข้อมูล คือ อัตราที่เร็วกว่าก็จะทำให้ฮาร์ดดิสก์มีความเร็วในการทำงานสูง ฮาร์ดดิสก์รุ่นเก่า ๆ จะมีอัตราถ่ายโอนข้อมูลต่ำมาก ซึ่งจะมีหน่วยเป็นเมกะไบต์ต่อวินาที แต่อัตราการถ่ายโอนข้อมูลจริง ๆ อาจจะไม่ถึงก็ได้ ในฮาร์ดดิสก์รุ่นใหม่จะมีการใส่หน่วยความจำแคช (Cache) มาช่วยเพิ่มความเร็วในการถ่ายโอนข้อมูล หน่วยความจำแคชจะช่วยเสริมประสิทธิภาพในการอ่านข้อมูลจากดิสก์ หน่วยความจำแคชจะมีหน้าที่ในการรับเอาข้อมูลที่อ่านจากฮาร์ดดิสก์เพื่อส่งไปยังหน่วยความจำของเครื่อง ซึ่งความเร็วที่เพิ่มขึ้นนี้ก็เพราะว่าการอ่านข้อมูลจากดิสก์ เพื่อส่งไปหน่วยความจำจะช้ากว่าการอ่านข้อมูลจากหน่วยความจำไปยังหน่วยความจำ ซึ่งหน่วยความจำตัวแรกที่พูดถึงก็คือ แคชนั่นเอง และสาเหตุสำคัญที่ทำให้แคชช่วยเพิ่มความเร็วในการถ่ายโอนข้อมูลก็คือ เมื่อดิสก์อ่านข้อมูลไปเก็บไว้ในแคช แคชก็จะส่งข้อมูลนั้นไปให้กับหน่วยความจำ และข้อมูลในแคชก็จะคงอยู่จนกระทั่งมีข้อมูลมาใหม่มาเขียนทับลงไป แต่ตราบใดที่ข้อมูลนั้นยังอยู่ในแคช หน่วยความจำของคอมพิวเตอร์ก็สามารถเรียกเอาข้อมูลนั้นจากแคชไปได้โดยที่ตรง ไม่ต้องกลับไปเรียกข้อมูลจากฮาร์ดดิสก์อีก ซึ่งจะช่วยลดเวลาในการค้นหาข้อมูลได้ การดูแลรักษาฮาร์ดดิสก์ด้วยวิธีง่ายๆ วิธีดูแลรักษาฮาร์ดดิสก์ง่ายๆ คือ ใช้โปรแกรมที่มีหน้าที่ในการตรวจสอบฮาร์ดดิสก์ เช่น Scandisk เพื่อตรวจหาข้อผิดพลาดที่อาจจะเกิดขึ้นบนฮาร์ดดิสก์ซึ่งถ้าไม่รีบหาข้อผิดพลาดและปล่อยให้ปัญหาลุกลามไปอาจทำให้ข้อมูลในฮาร์ดดิสก์สูญหายไปหมด อีกสิ่งหนึ่งที่จะช่วยให้ฮาร์ดดิสก์มีการทำงานด้วยความเร็วสม่ำเสมอ คือ การทำ Optimize disk โดยใช้โปรแกรมที่ใช้ในการจัดเรียงข้อมูลบนฮาร์ดดิสก์ เช่น Defrag ซึ่งสาเหตุที่จะต้องมีการทำก็เพื่อให้ข้อมูลในฮาร์ดดิสก์เรียงตัวกันเป็นระเบียบ เพื่อความรวดเร็วในการอ่านข้อมูล การเข้าถึงข้อมูลในฮาร์ดดิสก์เป็นการเข้าถึงแบบแรนดอมหรือเป็นแบบสุ่ม ไม่ได้เป็นการเข้าถึงข้อมูลแบบซีเควนซ์ (Sequence) หรือแบบเรียงลำดับ เหมือนอย่างเทปแบ็กอัพ ดังนั้นในการเขียนข้อมูลฮาร์ดดิสก์ก็จะมองหาว่า พื้นที่ใดที่เป็นพื้นที่ว่างที่พอจะเขียนข้อมูลลงไปได้ เมื่อใช้งานไปนาน ๆ ก็จะทำให้เกิดพื้นที่ว่างที่ไม่ต่อเนื่องกัน เพราะว่าจะมีข้อมูลบางส่วนที่ลบหรือย้ายไปในโฟลเดอร์หรือไดเรคทอรีอื่น เมื่อฮาร์ดดิสก์เขียนข้อมูลตัวเดียวกันลงไปในพื้นที่ว่างที่ไม่ต่อเนื่องกัน ทำให้การอ่านข้อมูลของฮาร์ดดิสก์ช้าลง เพราะจะต้องไปเสียเวลาหาข้อมูลจากหลายๆ ตำแหน่งบนฮาร์ดดิสก์ แทนที่จะหาได้จากตำแหน่งที่อยู่ติดกัน ส่งผลให้ความเร็วในการค้นหาข้อมูลลดลง และถ้าจะต้องค้นหาไฟล์ที่มีขนาดใหญ่จากหลายๆ ตำแหน่งบนฮาร์ดดิสก์ก็คงจะต้องใช้เวลามากพอสมควร ดังนั้น ในการจัดเรียงข้อมูลนั้นก็เพื่อให้ข้อมูลได้มีการเรียงลำดับกันอย่างถูกต้องและเป็นระเบียบ ง่ายต่อการค้นหาข้อมูล เกร็ดความรู้ เรื่อง RAID : Redundant Array of (Independent) Inexpensive Disks from http://tiwrm.hpcc.nectec.or.th What is RAID RAID ย่อมาจากคำว่า Redundant Array of (Independent) Inexpensive Disks เป็นวิธีการเก็บข้อมูลให้กระจายไปในดิสก์หลายๆ ตัวเพื่อช่วยให้การเพิ่มประสิทธิภาพในการอ่านและเขียนข้อมูล หรือเพื่อช่วยเพิ่มความน่าเชื่อถือในการเก็บข้อมูล หรือทั้งสองอย่าง จุดประสงค์เบื้องต้นของ RAID ในสมัยแรกเริ่มคือ การรวบรวมเอาดิสก์ขนาดเล็กและราคาไม่แพงมาต่อเข้าด้วยกันเพื่อให้มีขนาดและความสามารถทดแทนเหมือนดิสก์ขนาดใหญ่ที่มีราคาแพงๆ ได้ อย่างไรก็ตามในปัจจุบันดิสก์ขนาดใหญ่มีราคาถูกลงอย่างมากเมื่อเทียบกับเมื่อก่อน RAID จึงถูกใช้ในด้านการเพิ่มประสิทธิภาพและความน่าเชื่อถือ (reliability) ของระบบมากกว่าด้านราคา จึงทำให้คำว่า Inexpensive ถูกแทนที่ด้วยคำว่า Independent Software RAID การทำงานของ software RAID จะอาศัยCPU ของเครื่องคอมพิวเตอร์ซึ่งมีหน้าที่ทำงานทุกอย่างของ RAID ทำให้การทำงานช้าโดยเฉพาะเมื่อต้องทำการคำนวณ parity เช่น RAID-3 และ RAID-5 แต่จะมีราคาถูกเพราะไม่ต้องใช้อุปกรณ์พิเศษอื่น และบาง OS (เช่น Linux, NT) ก็มี software RAID ติดตั้งมาให้แล้ว software RAID สามารถทำงานได้ทั้งบน SCSI และ IDE ดิสก์ แต่อาจจะขาดความสามารถบางอย่างไปเช่น hot swap Hot Spare Disk ถ้ามีดิสก์ตัวใดตัวหนึ่งเสีย RAID จะใช้ดิสก์ที่เป็นตัว spare ทำการสร้างข้อมูลขึ้นมาใช้แทนดิสก์ตัวที่เสียไปโดยอัตโนมัติ Hot Swap Disk ถ้ามีดิสก์ตัวใดตัวหนึ่งเสีย ผู้ใช้สามารถถอดเอาดิสก์ตัวนั้นออกมาแล้วใส่ตัวใหม่เข้าไปแทนที่ได้โดยไม่จำเป็นต้องปิดระบบ กลุ่ม CX ณรงค์ศักดิ์ 2275 File Name: BCX501