ทำความรู้จักกับ “Gemini” โมเดล AI ตัวท็อปมาแรงจาก Google

 

 

Easetrack พามารู้จัก Gemini โมเดล AI ใหม่จาก Google ที่ผลการทดสอบเหนือกว่า GPT-4 เกือบทุกด้าน พร้อมให้ใช้งานบน Google Bard แล้ววันนี้

 

ปัญญาประดิษฐ์ (Artificial Intelligence : AI) เป็นโปรแกรมที่มาแรงมากในช่วงไม่กี่ปีที่ผ่านมา เนื่องจากมีการทำงานคล้ายกับสมองมนุษย์ที่สามารถคิด สร้างสรรค์ หรือวิเคราะห์ข้อมูลต่างๆ เองได้ และต้องบอกว่า AI ก็มีหลายรูปแบบให้เลือกใช้กันและได้เข้ามาเป็นส่วนหนึ่งในชีวิตประจำวันของเราไปบ้างแล้ว เช่น รถยนต์ขับเคลื่อนอัตโนมัติ, การปลดล็อกหน้าจอโทรศัพท์ด้วย Face ID, อุปกรณ์สมาร์ทโฮม หรือแอปบอกเส้นทาง Google maps

 

ล่าสุด Google เปิดตัว Gemini โมเดล AI ที่ทรงพลังที่สุดจาก Google ก้าวสำคัญในการพัฒนา AI ด้วยความสามารถหลากหลาย และพร้อมก้าวเป็นคู่แข่งของ OpenAI

 

การเปลี่ยนแปลงทางเทคโนโลยีทุกครั้งถือเป็นเป็นโอกาส ทั้งสามารถเร่งความก้าวหน้าของมนุษย์ และปรับปรุงการใช้ชีวิตให้ดีขึ้นได้ เช่นเดียวกับ AI ที่มีความสามารถทรงพลังมากที่สุดในขณะนี้ Google จึงได้เปิดตัว Gemini โมเดล AI ที่มีความสามารถสูงสุดของ Google สู่โอกาสครั้งใหม่ที่จะทำให้ AI มีประโยชน์สำหรับทุกคนบนโลก

 

เราทราบกันดีว่านับจากการเปิดตัวของ ChatGPT แห่ง OpenAI โมเดลภาษาที่ประมวลผลผ่านระบบปัญญาประดิษฐ์ขนาดใหญ่ โลกก็ถูกผลักดันเข้าสู่ยุคสมัยแห่ง Ai นับจากนั้นเป็นต้นมาเทคโนโลยีนี้ก็ได้รับการพัฒนาต่อเนื่อง และเริ่มเข้ามามีส่วนร่วมกับการใช้ชีวิตประจำวันของเราอย่างรวดเร็ว

 

ความสำเร็จของ GPT-4 จาก OpenAI ที่มีผู้ถือหุ้นใหญ่เป็น Microsoft ทำให้บริษัทไอทีน้อยใหญ่ทยอยกระโดดเข้าร่วมสมรภูมินี้ตามกัน ตั้งแต่ Bard จาก Google, Erine จาก Baidu, Meta AI จาก Meta, Tako จาก Tiktok รวมถึงบริษัทขนาดกลางและเล็กอีกมากมาย ด้วยจุดหมายในการยกระดับขีดความสามารถ Ai

 

 

Gemini Ai ใหม่พร้อมศักยภาพสุดล้ำ

 

หลายท่านอาจรู้จักและได้ใช้งาน Ai จากฝั่ง Google อย่าง Bard มาไม่มากก็น้อย แต่ล่าสุดบริษัทในเครืออย่าง Deepmind ก็ได้มีการเปิดตัวปัญญาประดิษฐ์อย่าง Gemini โมเดลภาษารุ่นใหม่ที่ได้รับยกระดับขีดความสามารถ และมีศักยภาพสูงยิ่งกว่าโมเดลภาษาที่มีการเปิดใช้งานล่าสุดอย่าง GPT-4

Gemini ได้รับการพัฒนาขึ้นจากฐานข้อมูลขนาดยักษ์นำไปสู่ปัญญาประดิษฐ์ที่มีความสามารถสูงสุดเท่าที่เคยมี ตัวโมเดลสามารถทำความเข้าใจอินพุตหรือข้อมูลที่ได้รับการป้อนหลากหลายรูปแบบ ตั้งแต่ข้อความ, โค้ด, ภาพ, เสียง, วีดีโอ และสามารถรันบนอุปกรณ์ได้ทุกชนิดตั้งแต่ซุปเปอร์คอมพิวเตอร์ไปจนสมาร์ทโฟน

จุดเด่นสำคัญของโมเดลปัญญาประดิษฐ์นี้คือขีดความสามารถเหนือชั้น จากผลการทดสอบ MMLU ที่ผสมผสานความรู้เชิงวิชาการไปจนความเข้าใจทั่วไปกว่า 57 สาขาพบว่า Gemini ได้รับคะแนนสูงถึง 90% ในขณะที่ GPT-4 โมเดลล่าสุดของ OpenAI ทำคะแนนได้ที่ 86.4%

นอกจากคะแนนในบททดสอบ MMLU แล้ว ขีดความสามารถของ Gemini ยังเหนือกว่า GPT-4 ในแทบทุกด้าน ตั้งแต่ในด้านคณิตศาสตร์ การเขียนโค้ด ไปจนการทำความเข้าใจข้อมูลชนิดต่างๆ ทั้งภาพ เสียง ไปจนวีดีโอ ล้วนมีขีดความสามารถในการทำความเข้าใจสูงกว่า GPT-4 ทั้งสิ้น

ด้วยศักยภาพนี้เองจะช่วยให้ Gemini ล้ำหน้าจนสามารถเข้าถึงและทำความเข้าใจข้อมูลที่ได้รับทุกรูปแบบมาประมวลผลและคิดหาคำตอบในการให้เหตุผลต่างๆ ได้อย่างมีเหตุผล ครอบคลุม และแม่นยำ จนสามารถหาคำตอบได้อย่างซับซ้อนและมีเหตุผลมากขึ้นต่อไป

 

“เป็นผลมาจากความพยายามร่วมกันครั้งใหญ่ในทีม Google และ Google Research เราสร้าง Gemini ตั้งแต่ต้นจนจบเพื่อให้เป็นได้หลายรูปแบบ หมายถึงสามารถสรุปและทำความเข้าใจ ดำเนินการ และรวบรวมข้อมูลประเภทต่าง ๆ เข้าไว้ด้วยกัน”

 

Google Gemini จะแบ่งเป็น 3 ขนาดด้วยกันคือ

 

1. GEMINI Ultra : เป็นโมเดลขนาดใหญ่ที่สุด โดยได้รับการออกแบบให้ใช้ในศูนย์ข้อมูลขนาดใหญ่หรือในองค์กรที่มีรูปแบบการทำงานซับซ้อน

2. GEMINI Pro : เป็นโมเดลขนาดรองลงมา เหมาะสำหรับการใช้งานที่หลากหลาย และกำลังเข้าไปทำงานเป็นเบื้องหลังแชตบอร์ดอีกตัวนึงของ Google ที่มีชื่อว่าบาร์ด (Bard)

3. GEMINI Nano : เป็นโมเดลขนาดเล็กที่สุด รองรับการทำงานบนสมาร์ทโฟนหรืออุปกรณ์พกพาต่างๆ เหมาะสำหรับการใช้งานทั่วไป

 

ในปัจจุบัน เราสามารถใช้ Bard ที่มีโมเดล GEMINI Pro ได้เรียบร้อยแล้ว แต่ยังจำกัดการใช้งานในสหรัฐอเมริกา และอีก 170 ประเทศที่ใช้ภาษาอังกฤษอยู่ ส่วนภาษาหรืออินพุตอื่นๆ จะมีการอัพเดตเพิ่มเติมในอนาคต ส่วนผู้ใช้สมาร์ตโฟน Pixel 8 Pro ของ Google ก็คาดว่าจะเริ่มเห็นฟีเจอร์ใหม่ๆ จาก GEMINI Nano และสำหรับ GEMINI Ultra คาดว่าจะเปิดให้บริการในปี 2024

 

 

พร้อมชน GPT-4 ของ OpenAI

 

Gemini ถูกเปรียบเทียบกับ GPT-4 ของ OpenAI และ Google และจากการทดสอบเกณฑ์มาตรฐาน พบกว่า 30 จาก 32 ข้อ ของ Gemini เหนือกว่า GPT-4 ของ OpenAI เนื่องจากได้รับการออกแบบมาให้จัดการข้อมูลที่หลากหลาย ตั้งแต่ข้อความ รูปภาพ วิดีโอ และเสียง ทำให้ Gemini ได้เปรียบได้ด้านเปรียบเป็นพิเศษในการทำความเข้าใจข้อมูล รวมถึงการโต้ตอบกับวิดีโอและเสียง

 

Sundar Pichai ซีอีโอของ Google และ Demis Hassabis ซีอีโอของ Google DeepMind กล่าวว่า Gemini เป็นโมเดลที่มีความสามารถมากที่สุดเท่าที่เคยสร้างมา ซึ่งจุดมุ่งหมายของ Gemini คือการทำให้ AI รู้สึกเป็นเหมือน Software น้อยลง แต่ให้เป็นเหมือนผู้ช่วย ผู้เชี่ยวชาญที่มีประโยชน์และใช้งานได้ง่ายมากขึ้น

 

การเปิดตัว Gemini ถือเป็นก้าวสำคัญของ Google ในการพัฒนา AI ถึงอาจจะยังไม่ทำให้ Google เปลี่ยนแปลงโลกได้ตามเป้าหมาย แต่อาจช่วยให้ตามทันเทคโนโลยีของ OpenAI ในการแข่งขันเพื่อสร้าง gen AI ที่ทรงพลังมากกว่าปัจจุบันนี้ และ Gemini จะกลายเป็นอนาคตของ Google ที่ยังไม่สายเกินไป

 

Gemini จะเป็นคู่แข่งที่น่ากลัวสำหรับ ChatGPT หรือไม่คุณต้องไปหาคำตอบเอง แต่ชาว Google ยืนยันว่านี่จะเป็นการเริ่มต้นยุคใหม่ที่ Google และพวกเขายังไม่หยุดแค่นี้ เพราะกำลังทำงานกันอย่างหนักเพื่อขยายความสามารถของ Gemini ไปสู่เวอร์ชันใหม่ ๆ ที่จะเกิดขึ้นในอนาคต รวมถึงพัฒนาในการวางแผนหน่วยความจำ เพิ่มบริบทสำหรับการประมวลผลข้อมูล เพื่อให้ได้การตอบสนองที่ดีขึ้นไปอีก และนี่จะเป็นการสร้างความเปลี่ยนแปลงในวิธีการทำงานและการใช้ชีวิตของคนนับพันล้านคนทั่วโลกอย่างแน่นอน

 

ที่มา: nipa, blog.google

Share to everyone