โดย JV Roig
ยินดีต้อนรับสู่ส่วนที่ 2 ในซีรีส์วิธีการใช้ Generative AI บน Alibaba Cloud
ใน ส่วนที่ 1 ของซีรีส์นี้, เราได้เรียนรู้การใช้ IaaS (การให้บริการโครงสร้างพื้นฐาน) GenAI ด้วย Elastic Compute Service (ECS) อย่างที่เราเห็นจากส่วนที่ 1 นี่เป็นวิธีที่ทรงพลังและยืดหยุ่นมากในการปรับใช้ Generative AI น่าเสียดายที่มาพร้อมกับขั้นตอนมากมายและค่าใช้จ่ายในการจัดการสูง เนื่องจากเรามีหน้าที่รับผิดชอบการดำเนินการและการบำรุงรักษาสแต็กทั้งหมด
เราจะทำให้มันง่ายขึ้น เร็วขึ้น และมีค่าใช้จ่ายน้อยลงได้ไหม? เราทำได้!
ในวันนี้เราจะมาเรียนรู้วิธีการใช้ PaaS (การให้บริการแพลตฟอร์ม) ด้วย Alibaba Cloud แพลตฟอร์มสำหรับ AI (PAI) เราจะมาดูกันว่าวิธีการ PaaS จะช่วยลดค่าใช้จ่ายในการดำเนินงานที่เกี่ยวข้องและช่วยให้เราสามารถปรับใช้บริการ Generative AI ที่เป็นประโยชน์ภายในไม่กี่นาทีได้อย่างไร
เข้าสู่ระบบเว็บคอนโซล Alibaba Cloud ของคุณแล้วค้นหา PAI คลิกผลลัพธ์ที่ปรากฏขึ้น (แพลตฟอร์มสำหรับ AI) และคุณจะเห็นคอนโซล PAI:
เราสามารถปรับใช้ LLM ได้อย่างรวดเร็วจากทั้ง เริ่มต้นใช้งานด่วน (ที่อยู่ใกล้กับด้านบนของแถบด้านซ้ายมือ) หรือ EAS/บริการอัลกอริทึมที่ยืดหยุ่น (ที่อยู่ใกล้กับตรงกลางของแถบด้านซ้ายมือ) ไม่ว่าในกรณีใด บริการนี้จะถูกใช้เป็นอินสแตนซ์ของ EAS ดังนั้นไม่ว่าอย่างไรก็ตามก็จะจบด้วย EAS ในที่สุด
เราไปกันที่ EAS กันเถอะ คลิก บริการอัลกอริทึมที่ยืดหยุ่น ภายใต้ การปรับใช้โมเดล และคุณจะเห็นหน้าจอนี้:
คลิก ปรับใช้บริการ
สำหรับบทช่วยสอนนี้ให้คลิก การใช้งาน LLM ภายใต้ การปรับใช้โมเดลตามสถานการณ์
สำหรับการปรับใช้ตัวอย่างนี้ คุณสามารถทำตามการตั้งค่าตามที่เห็นในภาพหน้าจอด้านบน:
• เราจะตั้งชื่อให้กับบริการของเรา เช่น test_service_deployment
• เราเลือก โมเดลโอเพนซอร์ส และเลือกโมเดลขนาดเล็กอย่าง Qwen2-7b (หมายเหตุ: ระวังอย่าเลือกเวอร์ชัน 72b ขนาดใหญ่โดยบังเอิญซึ่งแตกต่างกันมาก)
• เรายังคงรักษาประเภทอินสแตนซ์เริ่มต้นแต่ลบการเร่ง (BladeLLM ต้องใช้ประเภท GPU ที่แตกต่างกันซึ่งไม่สำคัญกับบทช่วยสอนพื้นฐานนี้)
นั่นคือทั้งหมดที่เราต้องเปลี่ยน คลิก ปรับใช้
นี่คือทั้งหมดที่เราต้องทำเพื่อสร้างโครงสร้างพื้นฐาน ซึ่งแตกต่างจากการปรับใช้ IaaS GenAI ที่ใช้ ECS! เพียงไม่กี่คลิกและใช้เวลาเพียงไม่กี่นาทีโครงสร้างพื้นฐานของเราก็พร้อมใช้งานแล้ว
นั่นคือพลังและความสะดวกในการใช้วิธีการให้บริการแพลตฟอร์มกับ GenAI
อาจใช้เวลาสักครู่เพื่อเสร็จสิ้นการปรับใช้และจากนั้นคุณจะเห็นสถานะที่เปลี่ยนเป็น กำลังทำงาน:
มีลิงก์ ดูเว็บแอป คลิกเพื่อเข้าสู่แอปพลิเคชันแชทสาธิตที่ติดตั้งมาให้กับบริการ ช่วยให้คุณทดสอบการใช้งานได้อย่างง่ายดาย:
ข้อความแรกที่คุณส่งจะใช้เวลาเล็กน้อยเนื่องจาก LLM ต้องใช้เวลาในการโหลดเข้าหน่วยความจำในตอนแรก อย่างไรก็ตามข้อความถัดไปของคุณจะถูกส่งอย่างรวดเร็วหลังจากการถ่ายโอนข้อมูลครั้งแรก
แน่นอนว่าเว็บแอปนั้นไม่ใช่ปัญหาหลักของเรา นั่นเป็นเพียงโบนัสเท่านั้น มาเริ่มรวมบริการ LLM เข้ากับแอปพลิเคชันของเราโดยใช้ API กันเถอะ!
นี่คือโค้ดตัวอย่างที่ใช้บริการ LLM API ที่เพิ่งปรับใช้ของเรา:
คุณจะต้องเปลี่ยนพารามิเตอร์ url และ การอนุญาต (บรรทัดที่ 4 และ 6) ด้วยพารามิเตอร์จริงของคุณจาก PAI EAS ในคอนโซล PAI EAS ให้คลิกที่ชื่อบริการที่คุณปรับใช้แล้วคลิก ดูข้อมูลปลายทาง จากหน้าจอ รายละเอียดบริการ ที่ปรากฏ ป็อปอัปที่มี URL ปลายทางและโทเค็นการยืนยันตัวตนจะปรากฏขึ้น
กลับไปที่โค้ด Python ของเรา ถ้าเราเรียกใช้โค้ด Python เราจะได้รับการตอบสนองต่อไปนี้:
เช่นเดียวกับการปรับใช้ GenAI ที่ใช้ ECS (IaaS) ของเรา LLM ตอบสนองเหมือนกับเป็นโจรสลัด (เพราะทำตามคำสั่งที่ป้อน) และได้ให้ไอเดียสำหรับวันหยุดการล่องเรือของเรา (เพราะคำสั่งของเรา)
เมื่อเทียบกับการปรับใช้ก่อนหน้าจากส่วนที่ 1 ของซีรีส์นี้ การปรับใช้และใช้งานทุกอย่างก็ง่ายดายขึ้นและรวดเร็วขึ้น จากชั่วโมงเป็นนาทีเมื่อเทียบกับ ECS!
ตอนนี้คุณอาจถามว่า: JV คุณมีวิธีที่ เร็วกว่านี้ ไหม?
มีสิ!
ครั้งต่อไปในส่วนที่ 3 เราจะตรวจสอบว่ามีวิธีที่เร็วกว่า: Alibaba Cloud Model Studio
แล้วพบกันใหม่!
เกี่ยวกับผู้เขียน: JV เป็นสถาปนิกด้านโซลูชันระดับอาวุโสใน Alibaba Cloud PH และเป็นผู้นำด้านข้อมูลและกลยุทธ์ Generative AI ของทีม หากคุณคิดว่าสิ่งใดในบทความนี้เกี่ยวข้องกับปัญหาทางธุรกิจในปัจจุบันของคุณ โปรดติดต่อ JV ที่ jv.roig@alibaba-inc.com
บทความนี้แปลจากภาษาอังกฤษ ดูบทความต้นฉบับ ที่นี่
72 posts | 3 followers
FollowRegional Content Hub - September 18, 2024
Regional Content Hub - September 18, 2024
Regional Content Hub - August 12, 2024
Regional Content Hub - April 7, 2024
Regional Content Hub - April 22, 2024
Regional Content Hub - May 7, 2024
72 posts | 3 followers
FollowTop-performance foundation models from Alibaba Cloud
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreA platform that provides enterprise-level data modeling services based on machine learning algorithms to quickly meet your needs for data-driven operations.
Learn MoreAccelerate AI-driven business and AI model training and inference with Alibaba Cloud GPU technology
Learn MoreMore Posts by Regional Content Hub