2 โครงสร้างการจัดเก็บข้อมูล

Page 1

การจัดโครงสร้างแฟ้มข้อมูล การจัดโครงสร้างแฟ้มข้อมูลเป็นการกาหนดวิธีการที่ระเบียนถูกจัดเก็บอยู่ในแฟ้มข้อมูลบนอุปกรณ์ที่ ใช้เก็บข้อมูล ซึ่งลักษณะโครงสร้างของระเบียนจะถูกจัดเก็บไว้เป็นระบบ โดยมีวัตถุประสงค์เพื่อให้การจัดเก็บ ข้อมูลและการเข้าถึงข้อมูลมีความสะดวกรวดเร็ว การจัดโครงสร้างของแฟ้มข้อมูลอาจแบ่งได้เป็น 3 ลักษณะ คือ 1. โครงสร้างของแฟ้มข้อมูลแบบลาดับ (sequential file) เป็นการจัดแฟ้มข้อมูซึ่งระเบียนภายใน แฟ้มข้อมูลจะถูกบันทึกโดยเรียงตามลาดั บคีย์ฟิลด์ หรืออาจจะไม่เรียงลาดับตามคีย์ฟิลด์ก็ได้ ข้อมูลจะถูก บันทึกลงในสื่อบันทึกข้อมูลโดยจะถูกบันทึกไว้ในตาแหน่งที่อยู่ติด ๆ กัน การนาข้อมูลมาใช้ของโครงสร้าง แฟ้มข้อมูล แบบล าดับ จะต้องอ่านข้อมูล ไปตามล าดับจะเข้าถึงข้ อมูล โดยตรงไม่ได้ ส่ ว นการจัดโครงสร้าง แฟ้มข้อมูลแบบลาดับตามดัชนี เป็นการจัดข้อมูลแบ่งตามหมวดหมู่ สรุปเป็นตารางซึ่งมีลักษณะคล้ายสารบาญ ของหนังสือ การจัดข้อมูลแบบนี้ทาให้สามารถเข้าถึงข้อมูลได้ง่าย โดยตรงไปที่ตารางซึ่งเป็นดัชนี จะทาให้ทราบ ตาแหน่ งของข้อมูล นั้ น โดยไม่ต้องอานข้อมูล ทีล ะระเบียน การจัดโครงสร้ างของแฟ้มข้อมูล แบบสั มพัทธ์ แฟ้มข้อมูล แบบสั มพัทธ์นี้ ข้อมูล จะถูกบั น ทึ กโดยอาศัย กลไกการกาหนดตาแหน่งของข้ อมูล ซึ่งจะช่ว ยให้ สามารถตรงไปถึงหรือบันทึกข้อมูลที่ต้องการได้โดยไม่ต้องอ่านหรือผ่านข้อมูลที่อยู่ในลาดับก่อนหน้าระเบียนที่ ต้องการ การดึงหรือการบันทึกข้อมูลจะสามารถทาได้อย่างรวดเร็ว ในโครงสร้างแฟ้มข้อมูล แบบลาดับประกอบด้วยระเบียนที่จัดเรียงไปตามลาดับอย่างต่อเนื่อ งเมื่ อ จัดสร้างแฟ้มข้อมูลโดยจะบันทึกระเบียนเรียงตามลาดับการบันทึกระเบียนจะถูกเขียนต่อเนื่องไปตามลาดับ จากระเบี ย นที่ 1 ถึงระเบี ย น n และการอ่านระเบียนภายในแฟ้มข้อมูล ก็ต้องใช้วิธีการอ่านแบบต่อ เนื่ อ ง ตามล าดั บ คื อ อ่ า นตั้ ง แต่ ต้ น แฟ้ ม ข้ อ มู ล ไปยั งท้ า ยแฟ้ ม ข้ อ มู ล โดยอ่ า นระเบีย นที่ 1,2,3 และ 4 มาก่ อ น ตัวอย่างเช่น ถ้าต้องการอ่านระเบียนที่ 8 ก็ต้องอ่านระเบียนลาดับที่ 1,2,3,4,5,6,7 ก่อน 2. โครงสร้างของแฟ้มข้อมูลแบบลาดับตามดัชนี (index sequential file) เป็นวิธีการเก็บข้อมูลโดย แต่ละระเบียนในแฟ้มข้อมูลจะมีค่าของคีย์ฟิลด์ที่ใช้เป็นตัวระบุระเบียนนั้น ค่าคีย์ฟิลด์ของแต่ละระเบียนจะต้อง ไม่ซ้ากับค่าคีย์ฟิลด์ในระบบอื่น ๆ ในแฟ้มข้อมูลเดียวกัน เพราะการจัดโครงสร้างแฟ้มข้อมูลแบบนี้จะใช้คีย์ฟิลด์ เป็ น ตัว เข้าถึง ข้ อ มูล การเข้าถึง ข้ อมูล หรื อ การอ่า นระเบีย นใด ๆ จะเข้าถึงได้ อย่ างสุ่ ม การจัดโครงสร้ า ง แฟ้มข้อมูลต้องบันทึกลงสื่อข้อมูลที่เข้าถึงข้อมูลได้โดยตรง เช่น จานแม่เหล็ก การสร้างแฟ้มข้อมูลประเภทนี้ไม่ ว่าจะสร้างครั้งแรกหรือสร้างใหม่ ข้อมูลแต่ละระเบียนต้องมีฟิลด์หนึ่งใช้เป็นคีย์ฟิลด์ของข้อมูล ระบบปฏิบัติการ จะนาคีย์ฟิลด์ของข้อมูลไปสร้างเป็นตารางดัชนีทาให้สามารถเข้าถึงระเบียนได้เร็ว นอกจากจะเข้าถึงระเบียนใด ๆ ได้เร็วขึ้นแล้วยังมีประโยชน์สามารถเพิ่มระเบียนเข้าในส่วนใด ๆ ของแฟ้มข้อมูลได้ ในแต่ละแฟ้มข้ อมูลที่ถูก บันทึกลงสื่อข้อมูลจะมีตารางดัชนีทาให้เข้าถึงระเบียนใด ๆ ได้รวดเร็วขึ้น โครงสร้างแฟ้มข้อมูลแบบลาดับตาม ดัชนีประกอบด้วย


1) ดัช นี (index) ของแฟ้มข้อมูล จะเก็บค่าคีย์ฟิล ด์ของข้อมูล และที่อยู่ในหน่ว ยความจา (address) ที่ระเบียนนั้นถูกนาไปบันทึกไว้ ซึ่งดัชนีนี้จะต้องเรียงลาดับจากน้อยไปมาก หรือจากมากไป น้อยโดยที่ส่วนของดัชนีจะมีตัวบ่งชี้ไปยังที่อยู่ในหน่วยความจา เพื่อจะได้นาไปถึงระเบียนข้อมูล ใน ข้อมูลหลัก 2) ข้อมูลหลัก (data area) จะเก็บระเบียนข้อมูล ซึ่งระเบียนนั้นอาจจะเรียงตามลาดับจาก น้อยไปมากหรือจากมากไปน้อย ในการจัดลาดับของข้อมูลหลักอาจจะจัดข้อมูลออกไปกลุ่ม ๆ โดยจะ เว้นที่ไว้เพื่อให้มีการปรับปรุงแฟ้มข้อมูลได้ 3. โครงสร้างของแฟ้มข้อมูลแบบสัมพัทธ์ (relative file) เป็นโครงสร้างที่สามารถเข้าถึงข้อมูลหรือ อ่านระเบียนใด ๆ ได้โดยตรง วิธีนี้เป็นการจัดเรียงข้อมูลเข้าไปในแฟ้มข้อมูลโดยอาศัยฟิลด์ข้อมูลเป็นตัวกาหนด ตาแหน่งของระเบียนนั้น ๆ โดยค่าของคีย์ฟิลด์ข้อมูลในแต่ละระเบียนของแฟ้มข้อมูลจะมีความสัมพัทธ์กับ ตาแหน่งที่ระเบียนนั้นถูกจัดเก็บไว้ในหน่วยความจา ค่าความสัมพัทธ์นี้ เป็นการกาหนดตาแหน่ง (mapping function) ซึ่งเป็นฟังก์ชั่นที่ใช้ในการเปลี่ยนแปลงคีย์ฟิลด์ของระเบียนให้เป็นตาแหน่งในหน่วยความจา โดยที่ การจัดเรียงลาดับที่ของระเบียนไม่จาเป็นต้องมีความสัมพันธ์กับการจัดลาดับที่ของระเบียนที่ถูกจัดเก็บไว้ใน หน่วยความจา การจัดเก็บข้อมูลลงแฟ้มข้อมูลแบบสัมพัทธ์ (relative file) จะถูกจัดเก็บอยู่บนสื่อที่สามารถเข้าถึงได้ โดยตรง เช่ น แผ่ น จานแม่ เ หล็ ก ลั ก ษณะโครงสร้ า งแฟ้ ม ข้ อ มู ล แบบสั ม พั ท ธ์จ ะประกอบด้ ว ยตาแหน่งใน หน่วยความจา ซึ่งเกิดจากนาคีย์ฟิลด์ของระเบียนมาทาการกาหนดตาแหน่ง ซึ่งการกาหนดตาแหน่งนี้จะทาการ ปรับเปลี่ยนค่าคีย์ฟิลด์ของระเบียนให้เป็นตาแหน่งในหน่วยความจาที่คานวณได้ แฟ้มข้อมูลหลัก แฟ้มข้อมูลนี้ ประกอบด้วยระเบียนที่จัดเรียงตามตาแหน่งในหน่วยความจาโดยจะเรียงจากระเบียนที่ 1 จนถึง N แต่จะไม่ เรียงลาดับตามค่าของคีย์ฟิลด์ การจัดโครงสร้างแฟ้มข้อมูลเป็นวิธีการจัดเก็บข้อมูลในคอมพิวเตอร์เพื่อให้สามารถใช้งานได้อย่างมี ประสิทธิภาพการเลือกโครงสร้างข้อมูลนั้นโดยส่วนใหญ่แล้วจะเริ่มต้นจากการเลือกประเภท ข้อมูลอย่างย่อโครงสร้างข้อมูลที่ออกแบบเป็นอย่างดีจะสามารถรองรับการประมวลผลที่หนักหน่วง โดยใช้ทรัพยากรที่น้อยที่สุดเท่าที่จะเป็นไปได้ทั้งในแง่ของเวลาและหน่วยความจา โครงสร้างข้อมูลแต่ละแบบจะเหมาะสมกับงานที่แตกต่างกัน และโครงสร้างข้อมูลบางแบบก็ออกแบบ มาสาหรับบางงานโดยเฉพาะ แนวความคิดในเรื่องโครงสร้างข้อมูลนี้ส่งผลกับการพัฒนาวิธีการมาตรฐานต่างๆในการออกแบบและ เขียนโปรแกรมหลายภาษาโปรแกรมนั้นได้พัฒนารวมเอาโครงสร้างข้อมูลนี้ไว้เป็นส่วนหนึ่งของ


ระบบโปรแกรม เพื่อประโยชน์ในการใช้ซ้า แฟ้มข้อมู ล ” (file) หมายถึงข้อ มูล สารสนเทศหรื อ ข้ อ มูล ทั้ง หมดที่เ ก็ บ ไว้ ในสื่ อ ที่ มี คุ ณสมบั ติ เ ป็ น แม่เหล็กไม่ว่าจะเป็นจานบันทึกธรรมดาหรือจานแข็ง (hard disk) ก็ตามข้อสนเทศที่นาไปเก็บนั้นจะ ถูกนาไปเก็บไว้เป็นเรื่องๆ ไป อาจจะเป็นโปรแกรมข้อมูล หรือภาพ (graphics) ก็ได้ แต่ละเรื่องต่างก็ ต้องมีชื่อเป็นของตนเองที่ต้องไม่ซ้ากัน 1.รูปแบบของการจัดระเบี ยบข้อมูล รูปแบบของการจัดระเบียบของข้อมูล ซึ่งมีอยู่หลายรูปแบบ ประกอบด้วยโครงสร้างพื้นฐานที่ลาดับจากหน่วยที่เล็กที่สุดไปยังหน่วยที่ใหญ่ขึ้นตามลาดับต่อไปนี้ 1.1 บิ ท (Bit : Binary Digit) คื อ หน่ ว ยของข้ อ มู ล ที่ เ ล็ ก ที่ สุ ด ที่ เ ก็ บ อยู่ ใ นหน่ ว ยความจ าภายใน คอมพิวเตอร์ ซึ่ง Bit จะแทนด้วยตัวเลขหนึ่งตัว คือ 0 หรือ 1 อย่างใดอย่างหนึ่ง เรียก ตัวเลข 0 หรือ 1 ว่าเป็น บิท 1 บิท 1.2 ไบท์ (Byte) คือหน่วยของข้อมูลที่นาบิทหลายๆบิทมารวมกัน แทนตัวอักษรแต่ละตัว เช่ น A, B, …, Z, 0, 1, 2, … ,9 และสัญลักษณ์พิเศษอื่นๆ เช่น $, &, +, -, *, / ฯลฯโดยตัวอักษร 1 ตัวจะแทนด้วยบิท7 บิท หรือ 8 บิทซึ่งตัวอักษรแต่ละตัวจะเรียกว่า ไบท์ เช่น ตัว A เมื่อเก็บอยู่ในคอมพิวเตอร์จะเก็บเป็น 1000001 ส่วนตัว B จะเก็บเป็น 1000010 เป็นต้น 1.3 เขตข้อมูล (Field) คือ หน่วยของข้อมูลที่เกิดจากการนาตัวอักขระหลายๆตัวมารวมกัน เป็นคา ที่มีความหมาย 1.4 ระเบี ย น (Record) คื อ หน่ ว ยของข้ อ มู ล ที่ มี ก ารน าเขตข้ อ มู ล หลายๆ เขตข้ อ มู ล ที่ มี ความสัมพันธ์กันมารวมกัน หรือค่าของข้อมูลในแต่ละเขตข้อมูล 1.5 แฟ้มข้อมูล (File) คือ หน่วยของข้อมูลที่มีการนาระเบียนหลายๆ ระเบียนที่มีความสัมพันธ์กัน มารวมกัน 1.6 ฐานข้อมูล (Database) คือ หน่วยของข้อมูลที่มีการนาแฟ้มข้อมูลหลายๆ แฟ้มข้อมูล ที่มี ความสัมพันธ์กันมารวมกัน 2.โครงสร้างแฟ้มข้อมูล โดยปกติ แ ฟ้ ม ข้ อ มู ล จะถู ก เก็ บ ไว้ ใ นหน่ ว ยความจ าส ารอง (secondary storage) เช่ น ฮาร์ ด ดิ ส ก์ เนื่องจากมีความจุ ข้อมูลสู งและสามารถเก็บได้ถาวรแม้จะปิดเครื่องไปซึ่งการจัดเก็บนี้จะต้องมีวิธีก าหนด โครงสร้างโดยมีวัตถุประสงค์เพื่อให้การจัดเก็บและเข้าถึงข้อมูลมีความรวดเร็ว ถูกต้องและเหมาะสมกับความ ต้องการการเข้าถึงและค้นคืนข้อมูลจะอาศัยคีย์ฟิลด์ในการเรียกค้นด้วยเสมอการจัดการจัดการโครงสร้าง แฟ้มข้อมูลมีปัจจัยที่ต้องพิจารณาในการเลือกโครงสร้าง ได้แก่


- ปริมาณข้อมูล ความถี่ในการดึงข้อมูล ความถี่ในการปรับปรุงข้อมูล จานวนครั้ งที่อ่านข้อมูล จาก หน่วยความจาสารองต่อการดึงข้อมูลการจัดโครงสร้างข้อมูลแบบต่างๆ - แฟ้มลาดับ (sequential file) - แฟ้มสุ่ม ( direct file หรือ hash file) - แฟ้มดรรชนี (indexed file) - แฟ้มลาดับดรรชนี (indexed sequential file) 2.1 โครงสร้างของแฟ้มข้อมูลแบบเรียงลาดับ (Sequential File Structure) เป็นโครงสร้าง ของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุดเนื่องจากมีลั กษณะการจัดเก็บข้อมูล แบบ เรียงลาดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆการอ่านหรือค้นคืนข้อมูลจะข้ามลาดับไปอ่านตรงตาแหน่ง ใดๆที่ต้องการโดยตรงไม่ได้เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่านตั้งแต่เรคคอร์ด แรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา การใช้ข้อมูลเรียงลาดับนี้จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไป เรื่อยๆตามลาดับและปริมาณครั้งละมากๆ แฟ้มข้อมูล แบบนี้ ถ้าเป็ น เครื่องคอมพิว เตอร์ระดับเมนเฟรมขนาดใหญ่ ก็จะจัดเก็บ อยู่ ใ น อุปกรณ์ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลาดับ (Sequential access) เวลาอ่านข้อมูลก็ต้องเป็นไปตามลาดับด้วยคล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต 2.2 โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure) เป็นลักษณะของ โครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรงเมื่อต้องการอ่านค่าเรคคอร์ดใดๆสามารถทาการเลือกหรืออ่าน ค่านั้นได้ทาให้การเข้าถึงข้อมูลได้รวดเร็วกว่าปกติแล้วจะมีการจัด เก็บในสื่อที่มีลักษณะการเข้าถึงได้ โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ต,ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น 2.3โครงสร้ างของแฟ้มข้อมูล แบบล าดับเชิงดรรชนี (Index Sequential File Structure) เป็ น ลั ก ษณะของโครงสร้ า งแฟ้ ม ข้ อ มู ล ที่ อ าศั ย กระบวนการที่ เ รี ย กว่ า ISAM (Index Sequential Access Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลาดับเข้าไว้ ด้วยกัน การจัดโครงสร้างแฟ้มข้อมูลวิธีนี้ข้อมูลจะถูกจัดเก็บเรียงกันตามลาดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์และการเข้าถึงข้อมูลจะทาผ่านแฟ้มข้อมูลลาดับเชิงดรรชนี (Index Sequential File) ซึ่งทา หน้าที่ช่วยชี้และค้นหาข้อมูลที่ต้องการได้สามารถทางานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ ข้อมูลในการประมวลผลมีจานวนมากๆ โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทางานคล้ายกับ รูปแบบดรรชนีท้ายเล่ม ซึ่งทาให้ง่ายและสะดวกมากยิ่งขึ้น


ตารางเปรียบเทียบโครงสร้างของแฟ้มข้อมูล โครงสร้างแฟ้ม 1.เรียงลาดับ

2.แบบสุ่ม

3.แบบลาดับดรรชนี

ข้อดี - เสียค่าใช้จ่ายน้อยและใช้ งานได้ง่ายกว่าวิธีอื่นๆ - เหมาะกับงานประมวลผล ที่มีการอ่านข้อมูลแบบ เรียงลาดับและในปริมาณ มาก - สื่อที่ใช้เก็บเป็นเทปซึ่งมี ราคาถูก

ข้อเสีย - การทางานเพื่อค้นหา ข้อมูลจะต้องเริ่มทาตั้งแต่ต้น ไฟล์เรียงลาดับไปเรื่อย จนกว่าจะหาข้อมูลนั้นเจอ ทาให้เสียเวลาค่อนข้างมาก - ข้อมูลที่ใช้ต้องมีการจัด เรียงลาดับก่อนเสมอ - ไม่เหมาะกับงานที่ต้อง แก้ไข เพิ่ม ลบข้อมูลเป็น ประจา เช่นงานธุรกรรม ออนไลน์ - สามารถทางานได้เร็ว - ไม่เหมาะกับงาน เพราะมีการเข้าถึงข้อมูล ประมวลผลที่อ่านข้อมูลใน เรคคอร์ดแบบเร็วมาก ปริมาณมาก เพราะไม่ต้องเรียงลาดับ - การเขียนโปรแกรมเพื่อ ข้อมูลก่อนเก็บลงไฟล์ ค้นหาข้อมูลจะซับซ้อน - เหมาะสมกับการใช้งาน - ไม่สามารถเข้าถึงข้อมูล ธุรกรรมออนไลน์ หรืองานที่ แบบเรียงลาดับได้ ต้องการแก้ไข เพิ่ม ลบราก การเป็นประจา - สามารถรองรับการ - สิ้นเปลืองเนื้อที่ในการ ประมวลผลได้ทั้ง 2 แบบคือ จัดเก็บดรรชนีที่ใช้อ้างอิงถึง แบบลาดับและแบบสุ่ม ตาแหน่งของข้อมูล - เหมาะกับงานธุรกรรม - การเขียนโปรแกรมเพื่อ ออนไลน์ ด้วยเช่นเดียวกัน ค้นหาข้อมูลจะซับซ้อน - การทางานช้ากว่าแบบสุ่ม และมีคา่ ใช้จ่ายสูง

สื่อที่ใช้เก็บ เทปแม่เหล็กเช่น เทปคาส เซ็ต

จานแม่เหล็กเช่นดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM

จานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์หรือ CD-ROM

3.ข้อดีของการจัดการข้อมูลด้วยแฟ้มข้อมูล 3.1 การประมวลผลข้อมูลได้รวดเร็ว เนื่องจากมีการแยกข้อมูลไว้เป็นแฟ้มต่างๆ 3.2 ลงทุนต่าในเบื้องต้น อาจไม่จาเป็นต้องใช้คอมพิวเตอร์ที่มีความสามารถมาก ก็สามารถทา การประมวลผลข้อมูลได้ 3.3 สามารถออกแบบแฟ้มข้อมูลและทาการพัฒนาได้ง่าย เนื่องจากมีขั้นตอนไม่สลับซับซ้อน มากนัก


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.