Friday, August 1, 2008

MIT Chapter 3

June 20, 2008
Lecture MIT Lesson 3 #1

CASE Data mining at Harrah’s

กลุ่มไหนซื้ออะไรไปบ้าง กลุ่มไหน ชอบซื้ออะไรไม่ชอบซื้ออะไร เพราะฉันนั้น การที่มีการ์ด Loyalty smart card ภาษาไทยเรียกว่าบัตรสะสมแต้ม
บัตรสะสมแต้ม จะsmart หรือไม่ smart ก็ได้ ถ้า smart ก็จะมี chip ในการเก็บข้อมูล ถ้าไม่ Smart ก็จะเป็นแผ่นกระดาษ เราจะไปกินกาแฟ หรือ ว่ายน้ำ ทีมีปั้มเป็นแต้มนั่นก็คือ Loyalty card แต่ไม่ smart แต่ถ้าเป็น chip ก็จะเก็บข้อมูลอยู่ใน chip เพราะฉันนั้นลูกค้าที่ได้บัตร เขาก็จะสมัคร โดยกรอก รายละเอียดข้อมูลตัวเอง ดังนั้นเมื่อมีบัตร จะเขาไปเล่น slot machine หรือว่าอะไรก็ตาม อย่างไปตามโต๊ะไปเสียบบัตร ก็จะรู้ว่าคนคนนั้น เล่นได้เท่าไหร่ เสียเงินเท่าไหร่ ข้อมูลเหล่านี้ เรียกว่า Transaction โดยเขาก็จะเก็บข้อมูลเหล่านี้ ไว้ใน data ware house หรือที่เรียกว่า Data warehouse ในที่สุด เขาก็ทำ CRM ได้ โดยเขาก็จะรู้ว่าลูกค้าส่วนใหญ่ที่เข้ามาเล่นเป็นลูกค้าชั้นดี ปรากฎว่า มีอายุในวัยกลางคน จนถึง ลูกค้าที่ใกล้เกษียณอายุแล้ว
ปรากฎเข้ามาเยอะ และเสียเยอะ ก็คือ คนกลุ่มนี้นี่เอง
เขาก็มาจัดกลุ่มลูกค้าเป็นกลุ่ม ๆๆ โดยทำโปรแกรม Management เพื่อเสนอ Promotion หรือ service พิเศษ ให้ นอกจากนั้นก็ยังใช้ข้อมูลเหล่านี้ ไป Track ว่าโต๊ะไหนทำเงินได้เยอะ
เพราะฉะนั้นในการที่เราทำวิเคราะห์ข้อมูลของ คาสิโน HARA นี้ ทำให้เราวิเคราะห์ได้เยอะ หลาย ๆ รูปแบบ
ในบทนี้ เราจะมาดูว่า ทำ ข้อมูลในองค์กรมีส่วนสำคัญ ข้อมูลเข้ามาอยู่ในหลาย ๆ ที่ในองค์กร นับวันจะมากขึ้นเรื่อย ๆ อยู่ในหลาย ๆ ฝ่ายขององค์กร บางอันมีข้อมูลสำคัญอยู่นิดเดียว
ข้อมูลจากภายนอกองค์กรก็มีความสำคัญขององค์กร เช่น จากลูกค้า จาก supplier นอกจากนั้นต้องบริหารให้ดี เรื่องความปลอดภัย คุณภาพของข้อมูล และความถูกต้อง ความสำคัญต่าง เลือกใช้ software ที่ถูกต้อง ในการบริหารข้อมูล
นี้คือวงจร Data Life Cycle Process
สังเกตให้ดี แหล่งที่มามี 3 ที่ (slide 6)

Internal ภายในองค์
External ภายนอกองค์กร
Personal data ข้อมูลที่พนักงานสร้างข้นมา

วงจรนี้ แสดงให้เห็นเส้นทางของการนำข้อมูลไปวิเคราะห์ ข้อมูลที่ เห็นทั่ว ๆ จะวิ่งไปทำ ในทางที่เป็น Operational เพื่อส่วนนี้จะไปนำรายงาน ไปทำงบการเงิน หรือ Report Routine เส้นทางที่เราเห็นด้านล่างนี้ แสดงให้เห็นว่า มี Data based อีกตัว ที่เรียกว่า Data ware house ที่เก็บข้อมูลเชิงวิเคราะห์ เครื่องมือในการวิเคราะห์ Data mining
วงจรชีวิตของข้อมูลปัญหาในองค์กรใหญ่ ๆ จะมีที่เรียกว่า Database หลายตัว หลายยี่ห้อ หลาย Physical
แล้วก็ การเก็บข้อมูล ต้องมีการเก็บข้อมูลที่นานมาก ตามกฎหมายให้เก็บ Transaction ถึง 5 ปี
เพราะฉะนั้นในการวิเคราะห์นี้ก็จะมี Tools ในการวิเคราะห์ (Tools = เครื่องมือ หรือโปรแกรมที่ช่วยเหลือ หรือเป็นโปรแกรมที่ช่วยเราทำอะไรสักอย่าง นั่นเอง คนใน IT เรียกว่า Software Tools)

Internal data ข้อมูลที่เกิดขึ้นในองค์กร เช่น Transaction ในองค์ที่ไหลเข้ามา Transaction = ธุรกรรม เช่น กฎระเบียบข้อมูลผลิตภัณฑ์ ข้อมูลลูกค้า ประวัติพนักงานที่เราต้อง key เข้าไป
Personal data คือสิ่งที่ พนักงานสร้างขึ้น มา หรือลักษณะ เอกสาร ที่สร้างขึ้นมาใน องค์กร วิธีการ ความเห็น หรือ e-mail
External data คือ ข้อมูลได้รับจาก ข่าวสาร ตัวเลขทางเศรษฐกิจ ข้อมูลที่ได้รับจาก Consultant หรือ แหล่งใหญ่ เหล่านี้ ก็มีความสำคัญทั้งนั้น
วิธีการเก็บข้อมูล ซึ่งในที่นี้ เราเรียกว่าข้อมูลดิบ คือ ข้อมูลที่ไม่ได้ประมวลผล
เราเอาข้อมูลมาได้อย่างไรบ้าง
 in the field บริเวณนอกบริษัท หรือ พื้นที่ที่อยู่นอก องค์กร
 from individuals
 via manually methods
 time studies
 Surveys
 Observations การสังเกตการ
 contributions from experts ไปสัมภาษณ์

 using instruments and sensors เครื่องมือต่าง ๆ เครื่องตรวจับ เครื่องอ่านบัตร สมาร์ทการ์ด RSIT Reader ตั๋วโดยสารเครื่องบินที่ไปแตะกับเครื่องนั่นก็คือการ sensor
 Transaction processing systems (TPS) เป็นระบบที่มีข้อมูลดิบมาเยอะ

***ลองสังเกตดูวา แต่ละบริษัท ของตน Transaction Processing มาจากไหน ระบบมันอยู่ตรงไหน
เช่นธนาคาร ก็คือหน้า counter หรือ การทำรายการ ATM

 via electronic transfer การทำ file transfer , down load file
 from a web site (Clickstream) ข้อมูลจาก WEB site ขององค์กร ก็สามารถเก็บข้อมูลมาวิเคราะห์ได้ ข้อมูล ซึ่งเรียกเป็นชื่อเล่น ว่า Clickstrem คือข้อมูลที่ click เข้ามาแล้วเก็บไว้
ดูในตารางหนังสือ หน้า 85 ข้อ 3.1
ข้อมูลในการออกแบบ ปัญหาที่มีคือ ข้อมูลที่เข้ามามักจะพบปัญหา
Incorrect data ข้อมูลไม่ถูกต้อง เช่นวันเดือดปี เกิด ที่ key เข้ามา เก็บ พศ คส ปนกันไป
Redundant data ข้อมูลซ้ำซ้อน คือ Transaction ของการขายของคนนี้ก็ยังมีเข้ามาอีก
Stolen data ข้อมูลที่หาย เก็บไว้ในกระดาษ แล้วมา keyทีหลัง แต่หายไปไม่ได้ key
Irrelevant data ข้อมูลที่ไม่เกี่ยวข้อง เช่นข้อมูลที่เราไม่ได้ใช้ แต่เก็บมา ก็จะเสียเวลาในการเก็บ
Missing data ข้อมูลที่ไม่ครบ ไม่ได้เก็บ Field บาง filed ที่เราต้องการใช้
เพราะฉะนั้นในการออกแบบ Data ต้องมีคุณสมบัติตาม 5 ข้อนี้

ข้อมูลที่เข้ามาเราก็จำเป็นต้องบริหารข้อมูล*
*Data Management : การบริหารข้อมูล
ข้อมูลเป็นสิ่งที่สำคัญขององค์กร (ผู้บริหารคอมพิวเตอร์เป็นผู้ดูแล) มีสิ่งสำคัญที่ต้องทำกับข้อมูลคือ
- Back Up การทำสำเนาของข้อมูลและนำมาเก็บไว้ และการเก็บข้อมูลก็นึกถึงความปลอดภัยของข้อมูลด้วย และนึกถึงการหายของข้อมูล
- Restore การนำกลับมาใช้งานใหม่ (โดยอาจจะต้องใช้เครื่องที่เสียยาก และทนทานในแง่ของ )
- IS Controls กฎระเบียบในการควบคุมดู แล ความถูกต้องของข้อมูล ที่เราร่างขึ้นมา
- Integrity (of data) เก็บให้ถูกต้อง

******************

Document Management ก็คือเอกสาร

ที่กล่าวมาข้างต้นส่วนใหญ่ จะเป็นตัวเลข record ค่อนข้างบริหารง่าย อีกส่วนหนึ่งถือเป็นข้อมูลเหมือนกัน แต่บริหารยากกว่าเช่น Document (กระดาษ) รูปภาพต่างๆ Video
เข้าไปวิเคราะห์ดูว่าในองค์ก็ยังคงเก็บข้อมูลเป็นกระดาษอยู่เสียเยอะ ยกตัวอย่างเช่น มีการสำรวจที่บริษัท Double A เค้าก็คิดว่าคนส่วนใหญ่ใช้คอมพิวเตอร์กันมากขึ้น การเก็บข้อมูลควรเป็นระบบ electronic กระดาษคงขายไม่ดี แต่ตรงกันข้ามกระดาษกลับขายดีขึ้นเรื่อยๆ ที่น่าสนใจคือมันเกิดอะไรขึ้น เพราะฉะนั้นเราต้องไปทำการเคราะห์ควบคุมการทำงาน โดยเรียกว่า Entire life cycle โดยให้ทำเป็น Soft copy ให้มากที่สุด โดยทำเป็น Format ที่นำมาเก็บไว้ในคอมพิวเตอร์ได้ เช่น PDF Adobe Lotus note ถ้าเป็น Digital แล้วก็จะบริหารได้ง่าย

ฉะนั้นการส่งเอกสารเป็นกระดาษ หรือ แบบฟอร์มต่างๆ ไม่ควรให้ทำเป็นกระดาษ หรือเอกสาร ควรทำลงบน electronic ให้ได้
ข้อคิดสำคัญของเอกสารอีกอย่างหนึ่งคือ เอกสารทุกฉบับ ต้องระบุวันที่ วันที่ผลิต เวลา security level version ต่างๆ โดยที่เราเห็นอยู่ก็จะมีเอาตรายางมาปั๊ม ลับ หรือ ลับที่สุดด้วย

ต่อมามาดูตัวอย่างในหนังสือ หน้า 87 จะมี case อยู่หลายอัน ประมาณ 6-7 แห่ง
CASE :
- Surgery Center of Baltimor สหรัฐ ที่ศูนย์การแพทย์ Baltimore
มีระบบ Medical Record Online ศูนย์บันทึกผู้ป่วย online โดยห้ามใช้กระดาษเด็ดขาด ไม่ว่าจะเป็นประวัติคนไข้ Billing & การประกัน ก็จะเก็บเป็น online ก็ได้ผลดีขึ้นค่าใช้จ่ายน้อยลง
ทำให้ลดค่าใช้จ่ายด้านเอกสารลง และทำให้กำลังใจของพนักงานดีขึ้น คือไม่ต้องทำอะไรมาก สามารถ online ได้เลย
- Amex บริการบัตรเครดิต American Express
ได้เก็บ survey เกี่ยวกับการท่องเที่ยวและบัตรเครดิต โดยที่ survey ของเค้ามี 600 แบบฟอร์ม มี12 ภาษา ก็ทำให้ยุ่งไปหมด เขาก็ได้เปลี่ยนจากกระดาษ มาเป็น ระบบ Electronic ก็ประหยัดค่าใช้จ่ายได้ถึง 17 เท่าทั้งบุคลากรและการใช้กระดาษ
- Life star บริษัทที่ให้บริการรถพยาบาลฉุกเฉิน
ก็ได้เก็บเอกสารต่างๆ รวมทั้งภาพถ่ายอุบัติเหตุต่างๆ ใน CD-ROM ทำให้สืบค้นได้ง่าย

Hierarchy of Data : ลักษณะโครงสร้างของ Data เริ่มจาก bit เป็น byte, byte รวมกันเป็น field, field รวมกันเป็น record, record รวมกันเป็น file

Database แปลว่า ฐานข้อมูล
จริง ๆ แล้วมีที่มา
การออกแบบ database จะยากกว่า ซึ่งเกิดจาก idea ที่ว่า แต่ละ application จะมี file ของตัวเองเพื่อใช้ในการทำงาน idea ของ database คือ ต่างคนก็เขียนโปรแกรม ก็มี file เก็บข้อมูลของโปรแกรม ก็จะมีโปรแกรมเกี่ยวกับการขาย และก็จะมี file ในการเก็บข้อมูล โปรแกรม ทางบัญชีก็มี file ในการเก็บข้อมูล สังเกตุว่าการเขียนโปแกรมก็จะมีฝ่ายในการเก็บข้อมูลเต็มไปหมด คนที่คิดเก็บฐานข้อมูล ก็คิดว่า บาง file ในการจัดเก็บก็จะมีใน แต่ละ file เหมือนกัน
ฉะนั้นก็จะมีซ้ำซ้อนในการจัดเก็บข้อมูล และมาคิดว่าควรจะมาเก็บไว้ที่เดียวกัน
นั่นก็จะเป็น idia เริ่มต้น
เอา file ที่เกี่ยวข้องจัดเป็นกลุ่มและเอามาไว้ใน Physical location มาไว้ด้วยกัน
การจัดเก็บข้อมูลก็จะมีสองลักษณะ

Centralized & distributed








Centralized database คือข้อมูลของลูกค้า และ file ต่าง ๆ อยู่ในที่เดียวกันเท่านั้น
ที่อื่น ๆ ก็จะต้องเข้ามาดูข้อมูลที่เดียวกัน เพื่อต้องการใช้ข้อมูล real time
ข้อเสียมี Server อยู่ตัวเดียว แต่ถ้า server หายก็อาจจะทำให้เสียหายได้ทั้งหมด
Distributed database คือข้อมูลสาขาต่างจัดเก็บไว้ในแต่ละสาขากระจ่ายไปตามสาขาต่าง ๆ

Software ที่ใช้ในการบริหาร Database Management System DBMS ก็จะมีแต่ละยีห้อ
Oracle,
จัดการบริการApplication program สามารถเข้าถึงข้อมูลได้ หรือทำ query ได้ มีหน้าทำข้อมูลให้ถูกต้องตรงกัน มีหน้าที่ทำ Replicate data ให้ตรงกัน ตาม ภาพ Distributed
Backup , การทำ Security คือแบ่ง การเข้าถึงข้อมูลว่าใครมีสิทธิ์เข้าได้บ้าง

******ฐานข้อมูลคืออะไร file หลาย ๆ file รวมกันก็เป็นฐานข้อมูล
จากรูปหน้า 26 ทั้งหมดเรียกว่า file, 1 บรรทัดเรียกว่า record (ถ้าเปรียบเทียบกับ microsoft excel 1 file จะมี1 record = 1 บันทึก) ในแผนภาพประกอบด้วย 10 field (เปรียบเทียบใน excel คือ column นั่นเอง) คือชนิดของบัตรเครดิต, หมายเลขบัตร, คำนำหน้าชื่อ เป็นต้น หลายๆ field รวมกันเป็น record, ถัดมาเป็น byte หลายๆ byte รวมกันเป็น field , ส่วน bit (0,1) 8 bit = byte

Lecture MIT Lesson 3 #2

ดูหนังเรื่อง 007
การรบสมัยก่อน ก่อการร้าย หรือการจับผู้ร้ายก็ตาม แต่ปัจจุบันจจะใช้ Notebook Hack เข้า note book ของนาย hack เอา Password ของนาย ผู้ร้ายก็ทำเช่นเดียวกัน การไปจับผู้รายแทนจะใช้อาวุธก็ใช้คอมพิวเตอร์
ข้อมูลที่เข้ามาก็จะมีเป็นส่วนใหญ่ ก็จะมีTransaction processing system TPS หรือจะเรียกว่าเป็น Operational Systems ก็ได้ คือระบบที่เป็นระบบ ภาคปฏิบัติ ขอมูลที่ Input เข้ามาซ้ำ ๆๆ กัน ซึ่งข้อมูลไปทำงบการเงิน ทำบัญชี ทำอะไรต่าง ๆเพื่อจะได้ให้งานเร็วขึ้น เอาไปส่งต่อให้ระบบอื่น อีกมุมหนึ่ง คือ Analytical processing การประมวลผลเชิงวิเคราะห์ ซึ่งเรามี Technique ต่าง ๆ โดย นำข้อมูลที่ไม่เคยดูนำไปวิเคราะห์
CASE: ความปลอดภัยของประเทศ
คือมีสหรัฐบุกอาฟกานิสถาน ได้พบ เครื่อง คอมพิวเตอร์ อยู่หลายเครื่อง โดยไปเปิดดูแล้วไปพบ ข้อมูลเกี่ยวกับก่อนการร้าย อยู่เยอะ ชื่อ สถานที่ เป้าหมาย ที่จะโจมตี เป็นจำนวนมาก ทำให้เขารู้ข้อมูลเบื้องต้นของผู้ก่อการร้ายอยู่ที่ไหน
โดยขณะนี่ หน่วยงาน ของ US เช่น FBI MI6 ก็ใช้ลักษณะการสืบค้นข้อมูล วิธีการดู คือเอาข้อมูล Transaction ปกติโดยทั่ว ๆ ไปมาวิเคราะห์ เช่น ข้อมูลเงินฝากธนาคาร การจองตั๋วเครื่องบิน
- ข้อมูลเงินที่ฝากไว้เยอะ ๆ จากหลายธนาคาร
- การจองตั๋วเครื่องบิน ก็จะรู้ได้ว่าไปที่ไหนบ่อย ๆ

การวิเคราะห์ข้อมูลมีอยู่ 2 วิธี
- Software Tools หรือ Medal ware มาดึงข้อมูลจาก Database ที่เป็น operational คือข้อมูลที่ ที่เราเก็บ Transaction ทุกวัน อ่านออกมา และนำ มาวิเคราะห์ คำนวณ ทำกราฟ
- การสร้าง Database ตัวใหม่ ขึ้นมา จะไม่เกี่ยวกับ Operational database ที่เราเรียกว่า Data ware house การนำข้อมูลมาวิเคราะห์ วัตถุประสงค์ เพื่อทำให้ข้อมูลมีความหมายทางธุรกิจมากขึ้น
เช่น Transaction ฝากถอน ของธนาคาร จำนวนเยอะมาก ยังสรุปอะไรไม่ได้ แต่โดยนำมาวิเคราะห์ ก็จะดูว่ามีอะไรผิดปกติรายการถอนเงินทีผิดปกติ หรือโอกาสทางธนาคารอาจจะเสนอ promotion ให้ลูกค้าที่
อีกเหตุผลหนึ่งคือ เอา
- Database ตัวใหม่ ให้ทำตามในลักษณะ Web-based application เป็นที่นิยม เพราะใช้งานง่ายสำหรับ user และ ควรเก็บข้อมูลไว้ที่เดียวกันเพื่อดูแลง่าย
ฉะนั้น Data warehouse คือ การเก็บข้อมูลที่เกิดขึ้นแล้ว นำมาจัดเรียงใหม่เพื่อใช้ในการวิเคราะห์ในรูปแบบต่างๆ (historical data)
tools ที่ใช้ในการวิเคราะห์อาจจะเป็น Data mining , DSS หรือ อะไรก็ได้
ข้อดีคือ เราสามารถรู้ได้ทันทีว่าข้อมูลอยู่ที่ไหน ถ้าจะวิเคราะห์ก็สามารถเข้าถึงได้งาน โดยอาจจะใช้ web browser
- Data warehouse จะต้องจัดให้เป็นระเบียบที่ดี และมี consistency คือ ถูกต้องตรงกัน
- Data warehouse เพื่อต้องการเก็บไว้หลาย ๆ ปี เพื่อจะได้นำมาเปรียบเทียบแต่ละช่วงเวลาได้ เช่นยอดขายย้อนหลัง 3 ปี ในแต่ละเดือน แต่ละ Quarter
- ห้าม update ห้ามแก้ไขเด็ดขาด เพราะถ้าแก้ไขเป็นเสมือนการโกงข้อมูล
- Relational database : database แบบที่เหมาะสมที่นำมาทำ data warehouseคือ relational database คล้ายๆ table มีความสัมพันธ์กันระหว่างแต่ละ field
- ข้อมูลที่เก็บเป็น Client / Server คือ เก็บเป็น Server และให้ Client เข้าถึงได้ง่าย





Data Mart
เป็นลักษณะคล้ายๆ Data warehouse แต่เล็กกว่า








จากรูปหน้าสรุปได้ว่า เราจะนำ ข้อมูล จาก database สินค้าคงคลังที่ใช้อยู่ มาเก็บไว้ที่ database และจากนั้นก็นำไปวิเคราะห์ต่อกัน ส่วนของ data mart ก็ย่อยลงไปอีก mart คือร้านค้านั่นเอง
จะมีโปรแกรมที่ทำขาย คือ Data mining
Data mining คือ การทำเหมือนข้อมูล เป็นการหาข้อมูลจาก Transaction ที่มากมาย และค้นหา data ที่มีประโยชน์ เอามาดูมาวิเคราะห์ ประโยชน์ของ Data mining
- แนวโน้มกลุ่มตัวเลข แนวโน้ม และ พฤติกรรม
- ช่วยในการค้นหาที่ซ้อนอยู่ใน Traction ซึ่งดูด้วยตาจะมองไม่เห็น แต่ program นี้จะมองเห็น และวิคราะห์ออกมาได้
- การทำ Cross sale ซึ่งหมายถึง เสนอขายสิ้นค้าอีกอย่างหนึ่ง ในขณะที่ลูกค้ามาซื้ออีกอย่างหนึ่ง เช่น ตาม 7eleven ซื้อน้ำ พนักงานจะถามว่า รับซาลาเปาเพิ่มไหม
- การตรวจสอบ ข้อมูลที่มีความผิดปกติได้ด้วย เช่น การรูดบัตรที่ผิดปกติ ซื้อนาฬิกาแพง ๆ มากว่า 2 เรื่อนใน หนึ่งวัน แสดงว่าบัตรอาจถูกโจรกรรม
- การหาความสัมพันธ์ ของข้อมูลได้

การทำ Mining ก็ยังเป็นการหาจากข้อความได้ด้วย ที่สำคัญอีกอย่างหนึ่งก็คือ click stream ก็สามารถนำมาวิเคราะห์ข้อมูลได้ ด้วยถึงแม้ว่าจะเป็น Text
Application ของ Data mining มีได้ทุกสาขา เช่น
- ขายปลีก อะไรคือขายปลีก จะจัดpromotion อะไรดี
- ธนาคาร ติดตามหนี้เสีย
- หุ้น การซื้อขายหุ้น
- ประกันภัย คนเพศนี้ อายุนี้ มีความเสี่ยงใด จะได้คิดเบี้ยประกันถูก

Case หนังสือ หน้า 109

CASE : Victoria Secret : ผลิตภัณฑ์ของอเมริกา
Problem: ทำไมจึงเกิดปัญหา Death of an order ขึ้นคือ คนสั่งของแล้วไม่เอา เลิกหรือเปลี่ยนแบบมากมาย และยังมีVarious Data Stream คือมีการสั่งสินค้าหลากหลายรูปแบบ ไม่ว่าจะเป็น email fax กระดาษ และการชำระเงินก็ต่างกัน ซึ่งเกิดจากพฤติกรรมลูกค้าทั้งสิ้น
ฉะนั้นจึงต้องการทราบพฤติกรรมของลูกค้าเหล่านั้น จึงนำข้อมูลมารวบรวมเก็บไว้ที่ data warehouse เรียกว่า enterprise data warehouse และใช้เครื่อง NRC เป็นโปรแกรมในการจัดเก็บ จึงสามารถวิเคราะห์ได้ และเอา click stream มาเช็ค วิเคราะห์ด้วย คนจะซื้อของ
ผล ก็คือ (15 million email: offers/invitation) สามารถทำ offer promotion ให้ลูกค้าเฉพาะรายได้ คือสามารถส่ง email ได้ร้อยกว่าล้าน และยังเชิญมาร่วมงานแสดงสินค้าด้วย

CASE AT&T ก็เอาโปรแกรมมาวิเคราะห์ call ต่าง ๆ เพื่อนำมาโปรโมชั่น

ภาพนี้เป็นตัวอย่าง Data Operational ของห้างแห่งหนึ่ง มี file จากการตลาด ต้องการทำโปรโมชั่น โดยหาบัตรใดที่มีคนใช้มากที่สุดเป็นอันดับแรก
เรามาดู operational database ของสาขาชิดลม สังเกตว่ามี Transaction เข้ามาเยอะมาก
มีทั้ง ชนิดบัตร คำนำหน้า ชื่อนามสกุล

รูป slide ที่ 37

แต่ปรากฎว่าก็มี Operational database อีกชุดหนึ่ง เป็นสาขาลาดพร้าว
รูป slide ที่ 38

จะพบว่ามีปัญหาของ Data base ที่กระจัดกระจ่ายขาด Integrity เช่น ในคำนำหน้า ชื่อ ก็ใช้คนละแบบ มีไม่เหมือนกัน และมี filed ทีไม่ถูกต้องตรงกัน (Consistency )

เพราะฉันนั้น จึงไปสร้าง Data ware house ขึ้น โดยลักษณะData warehouse คือ เราจะนำเอามาบางส่วน คือ บาง filed Field ที่เราไม่ต้องการ ก็ไม่เอามา เราก็จะได้ Data ware house ที่นำมาวิเคราะห์ได้

รูป slide ที่ 39

โดยโปรแกรมตัวนี้จะใช้ Software อะไรได้ excel, access ,

No comments: