Sports • Education

Practical Big Data Engineering in Generative AI Era #8

27 Mar 2024
IMC Institute, Floor/8th
กรุงเทพมหานคร, ประเทศไทย
0 followers


เรียนรู้การพัฒนา Big Data ด้วยเทคโนโลยีที่หลากหลาย
Hadoop, Google Cloud Platform, AWS, Azure
Hadoop HDFS, Hive, Apache Spark, Apache Airflow
Cloud Storage, Hadoop as a Service, Data warehouse as a Service
บนพื้นฐานหลักการ DevOps ด้วย Azure Pipeline
รวมถึงการนำ Generative AI อย่าง ChatGPT Advanced Data Analysis มาช่วยงาน


คำอธิบายหลักสูตร

ปัจจุบันมีการใช้เทคโนโลยีที่หลากหลายสำหรับจัดการและประมวลข้อมูลขนาดใหญ่ (Big Data) ทั้ง on-Premises Software และ on-Cloud Services ความเข้าใจในเรื่องความแตกต่างระหว่างเทคโนโลยีจึงเป็นสิ่งสำคัญต่อการเลือกใช้ให้เหมาะสมกับงานและความต้องการทางธุรกิจ ด้วยเหตุนี้ วิศวกรข้อมูลในยุคสมัยใหม่ (Modern Data Engineer) ซึ่งมีบทบาทหน้าที่ในการออกแบบและใช้งาน Data pipeline ที่เป็นการผสมผสานบูรณาการระหว่างเทคโนโลยีในแบบ Multi-Clouds หรือ Multi-Platforms จะต้องได้รับการพัฒนาความรู้ของตนเอง เพื่อให้ได้รับประโยชน์สูงสุดจากข้อมูลและใช้งานเทคโนโลยีต่างๆ ให้เกิดประโยชน์สูงสุดต่อไป

หลักสูตร Practical Big Data Engineering in Generative AI Era เป็นหลักสูตรที่ต้องการพัฒนาให้ผู้เรียนได้เข้าใจถึงการออกแบบสถาปัตยกรรมระบบ และ Data pipeline ให้มีความเหมาะสมกับโจทย์ทางธุรกิจ และสามารถใช้เครื่องมือที่หลากหลายในการจัดการข้อมูลและประมวลผลข้อมูล ซึ่งรวมถึงการทำ Big Data Analytics อย่างเช่น Descriptive Analytics ได้อย่างมีประสิทธิภาพ คณะผู้สอนได้นำประสบการณ์ตรงจากการเป็นผู้ลงมือทำ งานด้าน Data Engineer มาถ่ายทอดให้ความรู้กับผู้เรียน ผ่านการบรรยายภาคแนวคิดทฤษฎีต่างๆ การสาธิต และการให้ผู้เรียนลงมือปฏิบัติ (Lab/Hands-on) ด้วยการใช้เครื่องมือต่างๆ โดยใช้ระบบบน Cloud Platform สามรายคือ Google Cloud Platform,, Microsoft Azure และ AWS โดยมีการสอน Services ต่าง ๆ เช่น Apache Spark, Google Cloud Storage, Google Dataproc, Google BigQuery, Google AI Platform, Azure DataLake, Azure HDInsight, Amazon S3, Amazon EMR, Amazon Athena, Amazon Sagemaker รวมถึงการใช้ Azure Pipeline สำหรับการพัฒนาตามแนวทาง CI/CD เป็นต้น


นอกจากนี้ในปัจจุบัน Generative AI กำลังเข้ามา Disrupt งานทางด้าน Data Engineer และสามารถนำมาช่วยงาน Data Engineer ทั้งการเขียนโค้ด การวิเคราะห์ข้อมูล การทำ Data Science และ การทำ Data Visualization จึงมีการนำ ChatGPT Advanced Data Analysis มาสอนเป็นส่วนหนึ่งในในหลักสูตร


ค่าใช้จ่ายในการอบรม
21,900 บาท (ไม่รวมภาษีมูลค่าเพิ่ม 7%)
**พิเศษสุด รับ Voucher 1,400 บาท สำหรับสมัครใช้งาน ChatGPT Plus ภายในคลาส
**รับจำนวนจำกัด เพื่อประสิทธิภาพในการเรียนรู้ tools ต่างๆ

ตารางการฝึกอบรม
รุ่นที่ 8 : เริ่ม 27 มีนาคม 2567

ผู้สอน
ดร.ศักดิ์ เสกขุนทด (ดูโปรไฟล์ >> ที่นี่)
รศ.ดร.ธนชาติ นุ่มนนท์ (ดูโปรไฟล์ >> ที่นี่)
ผศ.ดร.ณัฐวุฒิ หนูไพโรจน์ (ดูโปรไฟล์ >> ที่นี่)
อาจารย์เอกอนันต์ ทองแท้ (ดูโปรไฟล์ >> ที่นี่)
อาจารย์สมหมาย กรังพานิช (ดูโปรไฟล์ >> ที่นี่)


 รูปแบบการอบรม
Physical Training
อาคารชุดสกุลไทย สุรวงศ์ ทาวเวอร์ ชั้น 8 (ใกล้ MRT สามย่าน ทางออก 1 และ BTS ศาลาแดงทางออก 3) >> ดูแผนที่
ทุกวันพุธ และ วันพฤหัสบดี
เวลา 09:00 น. - 16:00 น.


หลักสูตรที่เหมาะกับ
บุคคลทั่วไปที่สนใจจะพัฒนา Big Data และท่านที่ต้องการเป็น Big Data Professional โดยต้องมีความรู้พื้นฐานด้านไอที

ความรู้เบื้องต้นของผู้อบรม
มีความรู้พื้นฐานด้านการเขียนโปรแกรมพื้นฐาน หรือเขียนคอมพิวเตอร์ภาษาใดภาษาหนึ่งได้
มีความสนใจงานด้านวิเคราะห์และการพยากรณ์ข้อมูล

Course Outline
Module 1: Data Engineering in Big Data Ecosystem ( 1 Day)
- Big Data ในสภาพแวดล้อมทางธุรกิจที่หลากหลาย (3 ชม.)
  • ความสำคัญของข้อมูลขนาดใหญ่ที่มีต่อการดำเนินงานด้านวิศวกรรมข้อมูล
  • JMI for Data Analyst
  • Data Governance
- เทคโนโลยี Big Data และตัวอย่างการประยุกต์ใช้งานในประเทศไทย (3 ชม.)
  • รูปแบบการออกแบบสถาปัตยกรรมข้อมูลขนาดใหญ่
  • Use case เกี่ยวกับการใช้ GenAI กับ Data Engineer  

 

Module 2: Designing Modern Big Data Architecture (1 Day)

- Big Data Life Cycle และเทคโนโลยีเกี่ยวข้อง (2 ชม.)

  • หลักการของ Data Warehouse และ Data Lake
  • หลักการการออกแบบสถาปัตยกรรมข้อมูลขนาดใหญ่ และการใช้ ChatGPT ช่วยออกแบบสถาปัตยกรรม
  • เทคโนโลยี Apache Hadoop

- Big Data as a Service บน Public Cloud Platform ต่าง ๆ (2 ชม.)

  • เปรียบเทียบ Big Data Services บน Public cloud กับระบบบน On-premise
  •  Big Data Services บน Microsoft Azure, GCP, AWS, Huawai Cloud, etc.

- Generative AI for Data Analysis (3 ชม.)

  • How to use Generative in data life cycle,
  • ChatGPT Advanced Data Analysis.
  • Data engineering using Generative AI


Model 3: Practical Data Engineering with Generative AI (2 Days)

       (ผู้บรรยายสาธิต และมีวีดีโอให้ผู้เรียนได้ทดลองปฏิบัติตาม) อ.เอกอนันต์

  • สรุปการใช้ Cloud Services ใน Data Pipeline ตั้งแต่ raw data สู่ cleaned data
  • Data Parsing: การสร้าง Structural data จาก Unstructural data ด้วย Generative AI [ดูตัวอย่าง]
  • Data Profiling/Data Understanding: การทำความเข้าใจข้อมูลผ่านค่าทางสถิติ ด้วย Generative AI
  • Data Preparation: การปรับแต่งข้อมูล ด้วย Generative AI กรณีศึกษา Data Warehousing [ดูตัวอย่าง]


Module 4: Fine-tuning AI model for better works (2 Days)

      (ผู้บรรยายสาธิต และมีวีดีโอให้ผู้เรียนได้ทดลองปฏิบัติตาม)  อ.เอกอนันต์

  • ทำความเข้าใจสถาปัตยกรรม LLMs และ Prompt Design
  • การปรับแต่งโมเดลด้วยเทคนิคที่หลากหลาย เช่น Quantization, LoRA
  • เรียนรู้การใช้งาน module/library เช่น BitsandBytes, PEFT, SFT อื่นๆ
  • ทดลองปรับแต่งโมเดล (Fine-tuning) เพื่อนำไปใช้ Data Paring กรณีศึกษา Graph Data [ดูตัวอย่าง]
Workshop #1: Preparing to be a Data Engineer in AI Era (1 Day)
 อ.เอกอนันต์
  • ทบทวนการใช้ Cloud Services สำหรับ Big Data Engineering
  • ทำความเข้าใจข้อมูล และสร้าง Data Profile ด้วยการใช้ Cloud Services และ ChatGPT
  • ปรับปรุงและปรับแต่งข้อมูลให้มีคุณภาพ ด้วยการใช้ Cloud Services และ ChatGPT
Module 5: IaC for Data Engineering (1 Day ) อ.สมหมาย
  • แนวคิดการนำ IaC (Infrastructure as Code) มาใช้สนับสนุนงาน Data Engineering
  • Containerization using Docker
  • Infrastructure and Configuration Management using Ansible/Terraform
  • Code Management using Git/GitLab/GitHub
Module 6: CI/CD for Data Engineering
อ.สมหมาย
  • การทำ Unit testing และการสร้าง Test cases ในงาน Data Engineering
  • เรียนรู้ Jenkins สำหรับทำ Automated Data Pipeline

Workshop #2 Real Life with Professional Big Data Engineer (1 Day )

อ.เอกอนันต์

  • ทดลองปฏิบัติงาน โดยสวมบทบาท Professional Big Data Engineer ที่มีการใช้ Automated Data Pipeline และใช้ ChatGPT ช่วยพัฒนาโค้ด บน Cloud Services [ดูตัวอย่าง]


Traning, genai, bigdata
Bade30ee6c8067601933102cf299117d17cd8220
Organized by
IMC Institute