3 การจัดการข้อมูล

Page 1

เทคโนโลยีสารสนเทศ

35 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

การจัดการขอมูล แฟมขอมูล ฐานขอมูล ซอฟตแวรที่เกีย่ วของกับการจัดการขอมูล แฟมขอมูล การจัดเก็บขอมูลในคอมพิวเตอรประกอบดวย หนวยตางๆ โดยเรียงจากหนวยทีเ่ ล็กที่สุดไปหาใหญ ที่สุดดังภาพ บิต(bit)

ไบต(byte)

เขตขอมูล(field)

ระเบียน(record)

แฟมขอมูล(file)

รูปแสดงหนวยในการเก็บขอมูลในคอมพิวเตอร ลักษณะของแฟมขอมูล เขตขอมูล(Field) หมายถึง หนวยเก็บขอมูลหนึ่งที่ถูกกําหนดขึ้นเพื่อใชเก็บคาขอมูลที่ตองการ ระเบียน(Record) หมายถึง กลุมของเขตขอมูลที่เกี่ยวของกัน ระเบียนขอมูลจึงประกอบดวยเขต ขอมูลตั้งแตหนึ่งเขตขอมูลขึ้นไป แฟมขอมูล(File) หมายถึง กลุมของระเบียน(record) ขอมูลที่มีเขตขอมูล(field)เหมือนๆ กัน ซึ่ง ประกอบด ว ยระเบี ย นข อ มู ล ตั้ ง แต ร ะเบี ย นขึ้ น ไป เช น แฟ ม ประวั ติ นั ก เรี ย นในชั้ น เรี ย นประกอบด ว ย ระเบียนขอมูลประวัติ ของนักเรีย นแตละคน ซึ่งประวัติเหลานี้มีเขตข อมู ลที่เหมื อนกัน โดยเขตขอมูลที่ เหมือนกันในแตละระเบียนอาจเปนคาที่เหมือนกันหรือตางกันก็ได แฟมขอมูล ระเบียน 1

ระเบียน 2

เขตขอมูล 1

………..

ระเบียน 3 เขตขอมูล 2

……

เขตขอมูล 2

ระเบียน …


เทคโนโลยีสารสนเทศ

36 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

- คียหลัก(Primary Key) คือ เขตขอมูลที่สามารถชี้แตกตางของขอมูลแตละระเบียนได - คุณสมบัตขิ องคียหลัก 1. Unique คือ มีความเปนหนึ่งเดียว ไมซ้ําใคร 2. Not Null คือ ตองไมเปนคาวางๆ - ประเภทของแฟมขอมูล การแบงประเภทของแฟมขอมูลมักแบงตามรูปแบบการเขาถึงขอมูล ซึ่งมี 3 ประเภทดังนี้ 1. แฟมลําดับ เป น แฟ ม ที่ มี โ ครงสร า งการเก็ บ ข อ มู ล แบบพื้ น ฐานที่ สุ ด คื อ ระเบี ย น(Record) จะถู ก เก็ บ เรี ย ง ตอเนื่องกันไปตามลําดับของเขตขอมูลคีย ซึ่งอาจเปรียบเทียบไดกับการเก็บขอมูลเพลงในเทปคาสเซต ซึ่ง สมมติวาในมวนเทปหนึ่งมีการเก็บเพลงได 10 เพลง ความยาวเพลงละ 3 นาที ซึ่งหากตองการคนหาเพลงใดก็ ตองเริ่มตนจากเพลงแรกไปเปนลําดับจนกวาจะพบ ตัวอยางแฟมในกลุมนี้ เชน แฟมขอมูลลูกคา ถาใช หมายเลขลูก ค าเปนเขตข อมู ลคี ย ระเบียนในแฟมก็จะเรีย งลําดับตามหมายเลขลู กคา การจัดโครงสร าง แฟมขอมูลลักษณะนี้เหมาะสําหรับขอมูลปริมาณมาก เชน ใบแจงหนี้คาโทรศัพทและโครงสรางแฟมขอมูลนี้ สามารถใชกับแถบแมเหล็ก(Magnetic Tape)หรือ จานแมเหล็ก(Magnetic Disk) ก็ได ในการเขาถึงขอมูลจึงตองอาศัยการอานขอมูลตั้งแตตน จนถึงขอมูลที่ตองการ เหมาะสําหรับการ อานขอมูลปริมาณมากและเรียงลําดับ แตไมเหมาะกับขอมูลที่มีการเพิ่ม ลบ หรือแกไขเปนประจํา 2. แฟมสุม เปนแฟมที่มีคุณสมบัติที่ผูใชสามารถอานหรือเขียนที่ตําแหนงใด ๆ ก็ไดโดยไมตองเรียงลําดับจาก ตนแฟม เชน กรณีของการเก็บขอมูลเพลงในเทปคาสเซต ถาตองการอนเพลงที่ 5 ก็จะคํานวณความยาวของ สายเทป เพื่อใหมีการเคลื่อนสายเทปไปยังตําแหนงที่ตองการแลวจึงเริ่มอาน กรณีนี้จะทําไดเร็วกวาสแบบ ลําดับ 3. แฟมดัชนี แฟมแบบนี้จําเปนตองมีการจัดเรียงขอมูลในเขตขอมูลที่เปนดัชนีเสียกอน เพื่อประโยชนในการ คนหา การหาตําแหนงในการเขียนการอานในระเบียนที่ตองการปกติจะใชขอมูลที่เปนกุญแจสําหรับการ คนหา เพื่อความสะดวกในการกําหนดตําแหนงการเขียนอาน ดังตัวอยางเชน ถาใชชื่อเพลงเปนกุญแจสําหรับ การคนหา จะมีการเก็บชื่อเพลงโดยมีการจัดเรียงตามตัวอักษร เมื่อคนหาชื่อเพลงได ก็ไดลําดับเพลง ซึ่ง สามารถนําไปคํานวณหาตําแหนงที่ตองการเขียนอานไดตอไป


เทคโนโลยีสารสนเทศ

37 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

- ขอดีและขอเสียของแฟมขอมูล ขอดีของแฟมขอมูล 1. การประมวลผลขอมูลทําไดรวดเร็ว 2. คาลงทุนในเบื้องตนจะต่ํา อาจไมจําเปนตองใชคอมพิวเตอรที่มีประสิทธิภาพสูงก็สามารถทํา การประมวลผลขอมูลได 3. โปรแกรมประยุกตแตละโปรแกรมสามารถควบคุมการใชงานในแฟมขอมูลของตนเองได ขอเสียของแฟมขอมูล 1. มีความซ้ําซอนของขอมูล(Redundancy) 2. ความยากในการประมวลผลขอมูลในแฟมขอมูลหลายแฟมขอมูล 3. ไมมีผูควบคุมหรือรับผิดชอบระบบทั้งหมด 4. ความขึ้นตอกัน(Dependency)ระหวางโปรแกรมประยุกตและโครงสรางของแฟมขอมูล


เทคโนโลยีสารสนเทศ

38 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

ฐานขอมูล - ความหมายของฐานขอมูล ฐานขอมูล หมายถึง การรวบรวมรายละเอียดของขอมูลที่มีความสัมพันธกัน จากแหลงตางๆ ใหมา อยูในที่เดียวกัน ผูใชงานสามารถใชขอมูลรวมกัน เพื่อใหเกิดการใชขอมูลที่มีประสิทธิภาพทั้งในแงของการ จัดการ และความถูกตองแมนยําของขอมูล การรวมขอมูลหรือไฟลตางๆ ที่มีความสัมพันธกัน เก็บอยูในที่เดียวกัน เพื่อประยุกตใชงานใน หลายๆ งานที่จําเปนตองใชขอมูลรวมกัน ซึ่งโดยปกติจะเก็บขอมูลตางๆ นี้ขึ้นอยูในสื่อขอมูลแบบ Direct Access เพื่อใหการเขาถึงขอมูลไดงายขึ้น และเปนการลดการซ้ําซอนของขอมูล ในระบบไฟลแตละ โปรแกรม จะตองมีไฟลขอมูลแยกเก็บเปนของตนเอง ซึ่งบางครั้งอาจมีความซ้ําซอนกันของไฟลขอมูลในแต ละโปรแกรมจึงไมเปนการประหยัดเนื้อที่ดิสกในการเก็บขอมูลที่ซ้ําซอนนั้น ในขณะที่ระบบฐานขอมูลจะมี การเก็บไฟลขอมูลตางๆ ไวที่เดียว ซึ่งหลายโปรแกรมสามารถเรียกใชรวมกันได จึงเปนการประหยัดเนื้อที่ ดิสก และทําใหการประมวลผลมีประสิทธิภาพ ตัวอยางเชน ไฟลขอมูลพัสดุ ซึ่งประกอบดวยรหัสพัสดุและ ชื่อพัสดุ อาจถูกเรียกใชในหลายระบบ ในองคกรหนึ่งๆ เชน ระบบสั่งซื้อ ระบบคลังสินคา ระบบบัญชีเปน ตน แตถาเปนระบบไฟลธรรมดาแลว แตละระบบจะตอง เก็บไฟลวัสดุไวเปนของตนเอง ซึ่งจะทําใหมีไฟลที่ ซ้ําซอนกันถึง 3 ไฟลในระบบ จากปญหาการซ้ําซอนของขอมูลนี้ นอกจากจะเปนการสิ้นเปลืองเนื้อที่ที่ใช เก็บขอมูลแลว ปญหาที่ตามมาอีกอยางคือ เมื่อมีการแกไขขอมูลที่เก็บซ้ําๆ กันอยูในแตละระบบ ก็จะตอง พยายามแกไขใหครบทุกแหงและเหมือนกันดวย เพราะถาไมตรงกันอาจทําใหเกิดความขัดแยงของขอมูล (Data Inconsistency) ขึ้น - องคประกอบของระบบฐานขอมูล 1. ฮารดแวร ไดแกอุปกรณตางๆ ทางคอมพิวเตอร ซึ่งอาจประกอบดวยเครื่องคอมพิวเตอรตั้งแตหนึ่ง เครื่องขึ้นไป การประมวลผลขอมูลในเครื่องระดับไมโครคอมพิวเตอรมี 2 แบบ 1. การประมวลผลฐานขอมูลในเครื่องๆเดียว โดยมีผูใชงานไดเพียงคนเดียวเทานั้นที่สามารถ ดึงขอมูลในฐานขอมูลได 2. นํ า เครื่ อ งหลายๆ เครื่ อ งมาเชื่ อ มต อ กั น ในลั ก ษณะเครื อ ข า ยซึ่ ง เป น รู ป แบบของระบบ เครือขายแบบมีลูกขายแมขาย(Client/Server Network) โดยจะมีการเก็บฐานขอมูลไวที่ เครื่องแมขาย การประมวลผลตางๆ กระทําที่เครื่องแมขาย สวนลูกขายจะมีหนาที่ในการดึง ขอมูลหรือสงขอมูลเขามาปรับปรุงในเครื่องแมขาย หรือคอยรับผลลัพธจากเครื่องแมขาย เทานั้น


เทคโนโลยีสารสนเทศ

39 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

การประมวลผลแบบนี้เปดโอกาสใหผูใชหลายคน สามารถใชงานฐานขอมูล รวมกันได ระบบฐานขอมูลเปนระบบการประมวลผลขอมูลที่มีปริมาณมาก จึงมีความตองการ ทางด านฮารดแวร ที่มีหนวยความจํ าหลัก หนวยความจําสํารองและหนวยประมวลผล ตลอดจนหนวยรับขอมูลเขาและแสดงผล ที่มีขนาดมากพอและมีความเร็วสูง เพื่อใหเกิดการ ประมวลผลที่มีประสิทธิภาพ 2. ซอฟตแวร 2.1 ระบบจัดการฐานขอมูล(Database Management System:DBMS) ทําหนาที่ควบคุมดูแล การสราง การเรียกใชขอมูล การแกไขขอมูลหรือโครงสราง ขอมูล การจัดทํารายงาน DBMS เปนตัวกลางในการประสานงานระหวางการเรียกใชฐานขอมูลในเครื่อง กับผูใชระบบ และจัดการใหผูใชแตละระดับมองเห็นขอมูลไดไมเทากันตามหนาที่ของผูใช แตละระดับ นอกจากนี้ DBMS ยังมีหนาที่ในการสรางและปรับปรุงไฟล การดึงขอมูลและการ ออกรายงานตางๆ ซึ่งจะชวยใหมีการจัดการฐานขอมูลไดอยางสะดวกรวดเร็ว ตัวอยางของ DBMS - DBMS ที่ใชในไมโครคอมพิวเตอรเทานั้น ไดแก ดีเบส(dBASE) ฟอกซเบส(FoxBase) Microsoft Access ฯลฯ

รูปที่ 26 โปรแกรม Microsoft Access

- DBMS ที่ใชทั้งในไมโครคอมพิวเตอร จนถึงเครื่องคอมพิวเตอรขนาดใหญ ไดแก ออราเคิล (Oracle) โปรเกรส(Progress) อินโฟร(Informix) Microsoft SQL Server ฯลฯ


เทคโนโลยีสารสนเทศ

40 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

2.2 ซอฟตแวรประยุกต เปนซอฟตแวรที่ถูกเขียนขึ้นโดยใชภาษาระดับสูงเชน C, COBOL เพื่อใชทํางานใน เรื่องใดเรื่องหนึ่งโดยเฉพาะ เชน โปรแกรมระบบสินคาคงคลัง โปรแกรมการสั่งซื้อ เปนตน 3. ขอมูล เปนองคประกอบที่จําเปนอีกอยางหนึ่ง ขอมูลที่เก็บอยูในฐานขอมูลควรมีคุณสมบัติดังนี้คือ 1. มีความถูกตอง ทันสมัย สมเหตุสมผล 2. มีความซ้ําซอนของขอมูลนอยที่สุด 3. มีการแบงกันใชงานขอมูล 4. ผูใช สามารถแบงออกเปนระดับตางๆ ได 2 ระดับคือ 4.1 ผูใชงาน(End User) เปนบุคคลที่นําสารสนเทศไปใชเพื่อวางแผนหรือการตัดสินใจใน ธุรกิจ โดยผูใชอาจเปนผูที่ไมมีความรูดานคอมพิวเตอรมากนักก็ได 4.2 ผูพัฒนาฐานขอมูล(Developer) เปนผูที่มีหนาที่รับผิดชอบตั้งแตการออกแบบ และการ เขียนโปรแกรมจัดการฐานขอมูล รวมไปถึงการดูแลบํารุงรักษาฐานขอมูล - ผูบริหารและจัดการฐานขอมูล (Database Administrator :DBA) มีหนาที่บริหารจัดการ งานของระบบฐานขอมูลและความตองการของบุคคลทุกกลุมใหประสานงานกันอยางมี ประสิทธิภาพ เปนผูตัดสินใจวาขอมูลที่จะเขานั้นมีอะไรบาง - นักเขียนโปรแกรม(Programmer) ทําหนาที่ในการพัฒนาหรือเขียนโปรแกรม - ลักษณะของขอมูลในระบบฐานขอมูล

นักเรียน

อาจารย

หองเรียน นักเรียน

วิชา หองเรียน

วิชา อาจารย

จากภาพแสดงข อ มูล ทั้ ง หมดที่ป ระกอบอยู ใ นฐานขอ มู ล สวนที่แรเงาคือสวนของข อมูลที่ซ้ําซอน ซึ่งสามารถเก็บแยก แฟมได โดยใหมีสวนชี้แสดงความสัมพันธถึงกันดังรูป ซึ่ ง โดยปกติ อ าจเก็ บ ชื่ อ อาจารย ที่ ป รึ ก ษาไว ใ นแฟ ม ของ นักเรียนเลยก็ได แตจะทําใหเสียเนื้อที่ในการจัดเก็บมาก จึงตอง สร า งตั ว ชี้ เพื่ อ แยกแยะข อ มู ล ในแต ล ะระเบี ย น เช น ข อ มู ล นักเรียนประกอบดว ย เลขประจําตัว ชื่อ สกุล รหัสอาจารยที่ ปรึกษา


เทคโนโลยีสารสนเทศ

41 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

- โครงสรางขอมูลในระบบฐานขอมูล ตัวชี้คือ สิ่งที่จะบอกวาของมูลของระเบียน(record)เดียวกันอยูที่ใดในแฟมอื่นๆ นักเรียน

053 041 028 010 008 สมศรี

อาจารย

01 02

02

06

วิชา

01

EE121

05

EE181

นายสมบัติ 01

นางนภา

03

ตัวอยางตองการคนหาขอมูลนักเรียน เชน รหัสประจําตัว 008 มีชื่ออะไร มีใครเปนอาจารยที่ปรึกษา และ อาจารยทานนี้สอนวิชาอะไร ลักษณะการคนหาคือ คนหาในแฟมนักเรียนทีละระเบียนจนพบระเบียนที่มี รหัสเปน 008 ก็จะทราบชื่อนักเรียนและมีคียเปนตัวชี้วาขอมูลนี้สัมพันธกับขอมูลในแฟมอาจารย ทําใหโยง ตอไดวาอาจารยชื่ออะไร และจะทราบคียซึ่งเปนตัวชี้วาอาจารยสอนวิชาอะไร เปนตน - ขอดีและขอเสียของฐานขอมูล ขอดีของฐานขอมูล 1. ขอมูลมีการเก็บอยูรวมกันและสามารถใชขอมูลรวมกันได 2. ลดความซ้ําซอนของขอมูล 3. สามารถหลีกเลี่ยงความขัดแยงกันของขอมูลที่อาจเกิดขึ้นได 4. การควบคุมความคงสภาพของขอมูล 5. การจัดการขอมูลในฐานขอมูลจะทําไดงาย 6. ความเปนอิสระระหวางโปรแกรมประยุกตและขอมูล 7. การมีผูควบคุมระบบเพียงคนเดียว ขอเสียของฐานขอมูล 1. การใชงานฐานขอมูลจะเสียคาใชจายคอนขางสูง 2. การสูญเสียขอมูลที่อาจเกิดขึ้นได


เทคโนโลยีสารสนเทศ

42 เอกสารประกอบการเรียนรายวิชา ง40101 เทคโนโลยีสารสนเทศพื้นฐาน

ขอแตกตางระหวางการประมวลผลขอมูลในระบบแฟมขอมูลและระบบฐานขอมูล การประมวลผลขอมูล ในระบบแฟมขอมูล ความซ้ําซอนของขอมูล - เปลืองเนื้อที่ - มีปญหาความขัดแยงกันของขอมูล ความยากในการประมวลผล - ยุงยากในการประมวลผล ในแฟมขอมูลหลายแฟม ผูรับผิดชอบระบบ - ขอมูลอยูแยกกัน ผูเขียนโปรแกรมดานใด ก็ดูแลเฉพาะขอมูลที่ตนเกี่ยวของทําใหไมมี ผูที่คอยดูแลระบบทั้งหมด ความเปนอิสระของขอมูล - ถาแกไขโครงสรางแฟมขอมูลก็ตองแกไข โปรแกรมประยุกตที่เกี่ยวของดวยเสมอ ขอแตกตาง

1. 2. 3. 4. 5.

การประมวลผลขอมูล ในระบบฐานขอมูล -เก็บขอมูลเรื่องเดียวไวที่เดียวจึงชวยลดความ ซ้ําซอนของขอมูล -มี DBMS เปนผูจัดการให -ขอมูลเก็บอยูที่เดียวกันทําใหงายตอการดูแล ทั้งระบบ -โครงสร า งตารางและตั ว ข อ มู ล เก็ บ อยู ใ น ฐานขอมูลทั้งหมด โปรแกรมประยุกตจึงไม จําเปนตองเก็บโครงสรางเหลานี้ไว เมื่อแกไข โครงสรางตารางหรือตัวขอมูลก็ไมเปนเปน ตองแกไขโปรแกรมประยุกต

- ลักษณะการจัดการสารสนเทศที่ดี ลดความซ้ําซอนของขอมูล กําหนดมาตรฐานขอมูล มีระบบปองกันความปลอดภัยของขอมูล มีความเปนอิสระจากโปรแกรม รวมขอมูลเปนฐานขอมูลกลาง

แหลงอางอิง : สถาบันสงเสริมการสอนวิทยาศาสตรและเทคโนโลยี. หนังสือเรียนวิชาคอมพิวเตอร เทคโนโลยีสารสนเทศและคอมพิวเตอรระดับ มัธยมศึกษาตอนปลาย. กรุงเทพมหานคร : โรงพิมพคุรุสภลาดพราว, 2543. Sarah E. Hutchinson, and Stacey C. Sawyer. Computer Essentials. 2nd ed. Chicago : IRWIN, 1996


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.