phi3 คืออะไร

กระทู้สนทนา

เทคโนโลยี ปัญญาประดิษฐ์ (Artificial Intelligence) (AI) นวัตกรรม การพัฒนาซอฟต์แวร์

PHI-3 หรือ Pathways Language Model 3 เป็นโมเดลภาษาขนาดใหญ่ (Large Language Model - LLM) ที่พัฒนาโดย Google AI ซึ่งได้รับการออกแบบมาเพื่อยกระดับความสามารถในการประมวลผลภาษาธรรมชาติให้ก้าวไกลยิ่งขึ้น PHI-3 ถือเป็นหนึ่งในโมเดล AI ที่ทรงพลังและน่าตื่นเต้นที่สุดในปัจจุบัน โดยมีจุดเด่นในด้านความสามารถที่หลากหลายและประสิทธิภาพที่สูงลิ่ว

ความโดดเด่นของ PHI-3
PHI-3 มีความสามารถอันน่าทึ่งในการเข้าใจบริบทของข้อความที่ซับซ้อน ทำให้สามารถตอบคำถามและสร้างเนื้อหาที่สอดคล้องกับสถานการณ์ได้อย่างแม่นยำ

พัฒนาโดย Microsoft Research ซึ่งมีความสามารถในการประมวลผลภาษาธรรมชาติได้อย่างน่าทึ่ง แม้จะมีขนาดเล็กกว่าแบบจำลองอื่นๆ มาก phi3 สามารถทำงานได้ดีในหลายด้าน เช่น การตอบคำถาม การแปลภาษา และการสรุปความ แสดงให้เห็นถึงประสิทธิภาพที่สูงมากเมื่อเทียบกับขนาดของมัน

phi3 คืออะไร เป็น llm ที่โดดเด่นด้านไหน
Phi-3 เป็นตัวอย่างที่น่าสนใจของการพัฒนา AI ที่มุ่งเน้นประสิทธิภาพและความสามารถเฉพาะทาง แม้จะมีขนาดเล็กกว่าคู่แข่ง แต่ก็สามารถแสดงศักยภาพที่น่าประทับใจ โดยเฉพาะในด้านการคิดเชิงตรรกะและการแก้ปัญหา บทเรียนสำคัญที่ได้จาก Phi-3 คือการให้ความสำคัญกับคุณภาพของข้อมูลและการออกแบบโมเดลอย่างมีประสิทธิภาพ มากกว่าการเน้นเพียงแค่ขนาดของโมเดล

phi3
Phi-3 is a family of lightweight 3B (Mini) and 14B (Medium) state-of-the-art open models by Microsoft.

Phi-3 Mini

Phi-3 Mini is a 3.8B parameters, lightweight, state-of-the-art open model trained with the Phi-3 datasets that includes both synthetic data and the filtered publicly available websites data with a focus on high-quality and reasoning dense properties.
The model has underwent a post-training process that incorporates both supervised fine-tuning and direct preference optimization to ensure precise instruction adherence and robust safety measures.
When assessed against benchmarks testing common sense, language understanding, math, code, long context and logical reasoning, Phi-3 Mini-4K-Instruct showcased a robust and state-of-the-art performance among models with less than 13 billion parameters.

https://ollama.com/library/phi3

ไมโครซอฟท์ปล่อยโมเดล Phi-3 เทียบชั้น GPT-3.5 แม้ขนาดเล็กจนรันบนโทรศัพท์ได้

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์แบบ LLM ขนาดเล็ก phi-3-mini ที่มีขนาดเพียง 3.8 พันล้านพารามิเตอร์ แต่สามารถทำคะแนน MMLU ได้ 69% และคะแนน MT-Bench 8.38 นับว่าใกล้เคียง GPT-3.5 อย่างมาก (MMLU 70.0%, MT-Bench 7.94) ชนะ Llama 3 ขนาด 8B ที่เพิ่งออกมาอีกด้วย
โมเดลตระกูล Phi-3 ยังมีอีกสองรุ่น คือ phi-3-small ขนาด 7B, และ phi-3-medium ขนาด 14B ขณะที่รุ่น phi-3-mini นั้นเมื่อใช้งานแบบ quantized 4 bit จะใช้แรมเพียง 1.8GB สามารถรันบน iPhone 14 ด้วยอัตรา 12 โทเค็นต่อวินาที
ในแง่ความปลอดภัย phi-3 ยังตอบสนองต่อเนื้อหาอันตรายน้อยลงกว่า phi-2 มาก เหลือเพียง 0.75% เทียบกับ phi-2 ที่ตอบ 2.93%
รายงานของไมโครซอฟท์ระบุว่าแม้ phi-3 จะสามารถให้เหตุผลได้เทียบเท่าโมเดลขนาดใหญ่ แต่ตัวโมเดลก็มีความจุจำกัดแล้ว ส่งผลให้คะแนนทดสอบบางหมวดเช่น TriviaQA นั้นทำได้ไม่ดีนัก และชุดข้อมูลที่ใช้ก็จำกัดเฉพาะภาษาอังกฤษอย่างเดียว โดยเบื้องต้นทีมงานเริ่มทดสอบใส่ข้อมูลหลายภาษาใน phi-3-small และดูจะได้ผลที่ดี แต่ไมโครซอฟท์ก็ยังไม่เปิดเผยผลทดสอบแต่อย่างใด

https://www.blognone.com/node/139363