description |
---|
มาดูกันว่าคลาว์มี AI สำเร็จรูปแบบไหนให้เราเล่นได้บ้าง ? |
นักพัฒนาหลายคนกำลังมองหาวิธีทำให้แอพมีลูกเล่นใหม่ๆ เช่นการนำ AI เข้ามาช่วย แต่หลายครั้งที่เจอคำว่า AI แล้วก็ส่ายหน้า เพราะคิดว่าของพวกนี้มันน่าจะเขียนโค้ดยาก ต้องเก่งด้านคณิตศาสตร์ชั้นสูงไรงี้ แต่ในความจริงแล้วเชื่อไหมว่าคนที่หัดเขียนโค้ดใหม่ๆก็สามารถเอา AI มาใช้งานได้แล้ว เพราะตัว AI นั้นจริงๆมีหลายระดับ ซึ่งในคอร์สนี้ผมจะพูดถึงการใช้ AI ในแบบที่ทุกคนจับต้องได้ด้วยสิ่งที่เรียกว่า Azure Cognitive Services ครับ
ขอเคลียให้เข้าใจตรงกันก่อนว่าสมัยก่อนถ้าเราจะเขียน AI ซักตัว เราจะต้องเริ่มเขียนกันใหม่ตั้งแต่เริ่มต้นเลย ดังนั้นมันเลยทำให้คนที่เขียน AI ต้องมีความรู้ในหลายๆอย่างเป็นอย่างมากถึงจะสร้างชิ้นงานออกมาซักตัวได้
จากปัญหาที่ว่ามาทาง Microsoft ก็เจอกับปัญหาพวกนี้เหมือนกัน เพราะเขาก็เขียน AI แต่ไหนๆก็เขียนออกมาแล้ว เขาเลยได้เอา AI ที่คนส่วนใหญ่ชอบใช้ ออกมาเป็นให้บริการบนคลาว์ เราจะได้ไม่ต้องไปเขียนใหม่ตั้งแต่ต้น แต่เปลี่ยนไปใช้ AI สำเร็จรูปที่มีอยู่แล้วได้เลย ตัวอย่างเช่น การตรวจใบหน้า
การแปลงเสียงเป็นข้อความ
การแปลภาษา
การค้นหา
แผนที่
การทายอายุจากรูป
การถอดข้อความจากรูป
และอื่นๆอีกยาวเหยียด
ดังนั้นสรุปง่ายๆคือ Microsoft มี AI สำเร็จรูปให้เราใช้ได้เลยนั่นก็คือ Cognitive Services นั่นเอง
ทาง Microsoft ได้ทำการแบ่งกลุ่มของ Cognitive Services ออกเป็น 5 กลุ่มความสามารถตามนี้
กลุ่ม | เกี่ยวกับ |
---|---|
Vision | การทำงานที่เกี่ยวกับ media ต่างๆ เช่นรูป วีดีโอ |
Speech | การทำงานที่เกี่ยวกับเสียง |
Language | การทำงานที่เกี่ยวกับภาษา เช่น แปลภาษา หรือ การจับใจความ |
Decision | การทำงานที่เกี่ยวข้องกับการตัดสินใจ เช่นมีคำหยาบไหม |
Search | การทำงานที่เกี่ยวข้องกับการค้นหา เช่น ค้นหารูป เขียนข้อความผิดหรือเปล่า |
จากทั้ง 5 กลุ่มที่ว่ามา เดี๋ยวเราลองไปดูรายละเอียดของแต่ละกลุ่มกันเลย
กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 6 อย่าง
ตัวนี้จะสามารถวิเคราะห์ข้อมูลจากรูปได้ ซึ่งตัวอย่างที่เอามาโชว์ให้ดูคือ
ตัวอย่างนี้จะแจกแจงของต่างๆที่อยู่ในรูปออกมาให้เราได้ เช่นจากตัวอย่างมันสามารถบอกได้ว่า มีคนอยู่ในรูป เป็นชานชาลา มีรถไฟ มีผู้หญิง และของแต่ละอย่างอยู่ตำแหน่งแกน X:Y
การถอดรูปภาพเป็นตัวหนังสือ (OCR)
รู้จักแบรนด์สินค้า คนดัง และสถานที่สำคัญ
การวิเคราะห์วีดีโอ
ตัวนี้สามารถทำการตรวจสอบทุกอย่างที่เกี่ยวกับใบหน้าได้ เช่น อายุเท่าไหร่ ผู้ชายผู้หญิง อยู่ในอารมณ์ไหน ใส่แว่นไหม รูปสองรูปนี้ใช่คนเดียวกันไหม บลาๆ ขอยกตัวอย่างรูปแค่อันเดียวละกันไม่งั้นบทความนี้ยาวแน่ๆ
ตัวนี้จะเป็นการทำงานที่เกี่ยวกับการเขียนที่อยู่ในรูปดิจิตอล เช่นพวกลายมือ ลายเซ็นอะไรพวกนี้ ซึ่งตัว AI ก็จะสามารถแจกแจงรายละเอียดของพวกนั้นออกมาได้ เช่นในรูปด้านล่างมันก็จะรู้ว่าเราวาดรูปวงกลม และเขียนคำว่า Microsoft
ตัวนี้จะสามารถตรวจรายละเอียดต่างๆของวีดีโอได้ เช่นวีดีโอพูดว่าอะไร หรือพูดอีกนัยว่ามันสามารถถอด metadata ของวีดีโอได้นั่นเอง เช่นปรกติเวลาค้นหาเราสามารถค้นหาจากข้อความได้ แต่ตัวนี้จะสามารถทำให้เราเอาข้อความไปค้นหาจากตัววีดีโอได้เลย
ตัวนี้เป็นตัวช่วยให้เราสามารถสร้างการแยกแยะสิ่งของในรูปแบบที่เรากำหนดเอง เช่น ในรูปมีตราบริษัทเราหรือเปล่า หรือแยกว่ารูปที่ส่งเข้ามาเป็นดอกไม้แบบชนิดไหน
ตัวนี้จะสามารถทำความเข้าใจรูปแบบฟอร์มแล้วแปลงมันออกมาเป็นข้อความได้ เช่น เรามีเอกสารเยอะๆแล้วต้องเอาเอกสารมาคีย์เข้าระบบที่ละแผ่น ก็แทนที่เราจะทำเองเราก็ให้ AI แปลงข้อความให้เราเลย
กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 2 อย่าง
ตัวนี้จะสามารถ แปลงคำพูดเป็นข้อความ, แปลงข้อความเป็นคำพูด และ แปลภาษาได้ ไม่มีรูปภาพปลากรอบเน่อ
ตัวนี้จะสามารถแยกแยะได้ว่า คนพูดคือใคร และยืนยันได้ว่าเสียงนี้เป็นของคนๆนั้นจริงหรือไม่ ตัวอย่างที่เห็นได้ชัดเจนสุดคือการทำ Login ด้วยเสียง
กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 5 อย่าง
ตัวนี้จะสามารถรับรู้ได้ว่า ข้อความนั้นผู้พิมพ์รู้สึกยังไง แยกวลีได้ แยกแยะสิ่งของหรือบอกได้ว่าเป็นภาษาอะไร ได้ ตัวอย่างที่เห็นภาพได้ชัด เอาไว้วิเคราะห์ว่ามีใครกำลังด่าเราอยู่ใน Twitter หรือเปล่า ฮ่าๆ
ตัวนี้คือวุ้นแปลภาษาของโดเรม่อนไง ซึ่งมันสามารถแปลงข้อความจากภาษานึงไปยังภาษาอื่นๆได้
ตัวนี้จะสามารถสร้าง คำถามที่ถามบ่อย จากข้อมูลที่เรามีได้
กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 3 อย่าง
สามารถดูรูปภาพวีดีโอข้อความต่างๆ แล้วตรวจสอบได้ว่ามีของที่ไม่เหมาะสมอยู่ในั้นหรือเปล่าได้
ตัวนี้จะช่วยตรวจสอบว่ามีของที่ผิดปรกติเกิดขึ้น ก่อนที่ปัญหามันจะเกิดให้เราได้ เช่นเตือนว่าหุ้นตัวนี้มันจะดิ่งลงเหวนะ ทั้งๆที่มันยังไม่ดิ่งเลย
ตัวนี้จะสามารถช่วยให้เราสร้าง User experience ให้ผู้ใช้ได้ดีขึ้น โดยการทำ loop เพื่อประเมินผลความชอบของผู้ใช้
กลุ่มนี้มี AI สำเร็จรูปอยู่ทั้งหมด 10 อย่าง แต่ขอเขียนแบบรวมๆนะครับบทความนี้มันยาวมากแล้ว
ตรวจสอบคำที่เขียนผิด
ค้นหาข้อมูลต่างๆจากเว็บทั่วโลก
ค้นหาวีดีโอ
ค้นหาข่าวสาร
สร้างการแนะนำของต่างๆให้เพื่อเป็นตัวเลือกให้ผู้ใช้ได้เลือก
การที่เราจะเอา AI เข้ามาใช้ในแอพของเราจริงๆมันไม่จำเป็นต้องไปเขียนใหม่ตั้งแต่เริ่มต้น เพราะคลาว์ก็มีให้บริการอยู่แล้ว ดังนั้นเราก็แค่เลือกใช้ AI ที่เขามีก็จะสามารถประหยัดเวลาในการไปสร้าง AI ขั้นมาตั้งแต่ต้น อีกทั้งบนคลาว์ AI มันจะฉลาดขึ้นไปเรื่อยๆและมีตัวเลือกมากขึ้นเรื่อยๆด้วยเช่นกัน ทำให้การใช้งาน AI ก็จะไม่ใช่เรื่องยากอีกต่อไป