วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

AI613 Lecture: Class 08 (12/01/2011)


Data Management

ระบบสารสนเทศ คืออะไร?
องค์ประกอบของระบบ 
  • วัตถุประสงค์
  • ส่วนประกอบ 
    • กระบวนการทำงานของระบบ ได้แก่ Inputs -> Process -> Outputs
เว็บไซท์อย่าง Twitter, Facebook, www.tbs.tu.ac.th, และ Google นั้นยังไม่ถือเป็นระบบสารสนเทศ ส่วนเว็บไซท์ที่เป็นตัวอย่างของระบบสารสนเทศ ได้แก่ Amazon เป็นต้น

การจัดการข้อมูลทำได้ยากด้วยสาเหตุต่างๆ เช่น
  • ข้อมูลเพิ่มขึ้นอย่าง exponential ตามเวลา 
  • ข้อมูลเกิดที่จุดที่งานเกิด จึงมีการกระจายอยู่ทุกส่วนขององค์กร 
  • ข้อมูลซ้ำซ้อนถูกสร้าง และเก็บ และใช้งานโดยไม่มีการควบคุมคุณภาพที่เพียงพอ ซึ่งแต่ละหน่วยงานก็จะมีลักษณะเฉพาะแตกต่างกันไป 
  • ข้อมูลภายนอกจำเป็นต้องถูกนำมาประกอบการพิจารณาในการตัดสินใจระดับองค์กร 
  • ความปลอดภัย และคุณภาพของข้อมูลเป็นสิ่งสำคัญมาก 
  • การเลือกเครื่องมือในการจัดการข้อมูลก็อาจเป็นปัญหาใหญ่ได้

เป้าหมายในการจัดการข้อมูลคือแปลงข้อมูลดิบให้เป็นสารสนเทศที่มีคุณภาพมากที่สุดสำหรับองค์กร ซึ่งจะสามารถสร้างได้นั้นจะต้องมี 4 องค์ประกอบนี้
  1. Data profiling: ทำความเข้าใจกับข้อมูล ข้อมูลอยู่ที่ไหน ใครเป็นเจ้าของ 
  2. Data quality management: พัฒนาคุณภาพของข้อมูล  
  3. Data integration: รวมข้อมูลที่เหมือนกันจากหลายๆแหล่งเข้าด้วยกัน 
  4. Data augmentation: พัฒนาคุณค่าของข้อมูล นำไปใช้ให้ตรงเป้าหมาย

Data Life Cycle Process
  1. การเก็บข้อมูลใหม่เกิดขึ้นจากหลายแหล่งข้อมูล ทั้ง Internal Data, External Data, และ Personal Data ซึ่งคือข้อมูลที่พนักงานใช้ เป็นความรู้อยู่ในระบบ Knowledge Management
  2. ข้อมูลจะถูกเก็บชั่วคราวในฐานข้อมูล จากนั้นนำไปประมวลผลก่อนเพื่อให้รูปแบบสอดคล้องกับคลังข้อมูลขององค์กร
  3. ผู้ใช้เข้าถึงคลังข้อมูลและคัดลอกข้อมูลที่ต้องการไปใช้ในการวิเคราะห์
  4. วิเคราะห์ข้อมูลเพื่อการบริหารด้วย Data analysis tools หรือ Data mining tools
ตั้งแต่ขั้นที่ 2 เป็นต้นไปจะเป็นกระบวนการที่สร้าง Value ให้กับข้อมูล ซึ่งทุกอย่างไม่จำเป็นต้องอยู่ในระบบ Computerize เสมอไป แต่ถ้ามีก็จะช่วยในการอำนวยความสะดวก

Data Warehouses (คลังข้อมูล) เป็น inputs ของ Data mining แต่ไม่ใช่ Database หลายอันรวมกันเป็นขนาดใหญ่
วัตถุประสงค์ของ Data warehouse คือเพื่อจัดตั้งเป็นที่เก็บข้อมูล ที่ทำให้เข้าถึงข้อมูลปฏิบัติการได้ในรูปแบบที่พร้อมใช้ในกระบวนการวิเคราะห์ โดยประโยชน์หลักๆของ Data warehouses ได้แก่ สามารถเข้าถึงข้อมูลได้อย่างรวดเร็ว เนื่องจากถูกเก็บไว้ในที่เดียว และสามารถเข้าถึงได้ง่าย และบ่อยด้วยตัวผู้ใช้เอง โดยผ่าน Web browsers
Data warehouse ไม่จำเป็นต้องมีในทุกองค์กร แต่องค์กรที่ต้องอาศัยข้อมูลในการตัดสินใจวิเคราะห์บ่อยๆ หรือเป็น Information-based organization ควรมี Data warehouse

Characteristics of Data Warehouses
  1. Organization: ข้อมูลถูก organize แบบ Subject-oriented
  2. Consistency: ข้อมูลจากฐานข้อมูลต่างๆอาจถูกเข้ารหัสไว้แตกต่างกัน แต่ในคลังข้อมูลจะถูกเข้ารหัสไว้ในรูปแบบเดียวกัน
  3. Time variant: ข้อมูลถูกเก็บไว้เป็นช่วงเวลา 5 ถึง 10 ปี ดังนั้นจึงสามารถดูแนวโน้ม พยากรณ์ และเปรียบเทียบได้ตามระยะเวลา
  4.  Non-volatile: เมื่อเข้าสู่คลังข้อมูลแล้ว ข้อมูลเหล่านั้นจะไม่มีการอัพเดทหรือเปลี่ยนแปลงใดๆทั้งสิ้น จะมีเพียงการเพิ่มเติม หรือ Refresh data เท่านั้น
  5. Relational: คลังข้อมูลใช้โครงสร้างเชิงสัมพันธ์ แฟ้มข้อมูลมีความสัมพันธ์เชื่อมโยงกันอยู่ การเรียกหาข้อมูลในแฟ้มหนึ่งจะโยงไปหาแฟ้มอื่นได้
  6. Client/Server: คลังข้อมูลใช้ Client หรือ Server เพื่อให้ผู้ใช้ข้อมูลสามารถเข้าถึงข้อมูลได้ง่าย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น