Python/Hadoop for (Young) Data Scientists
การอบรม Python/Hadoop Programming สำหรับผู้ที่ต้องการเป็น (Young) Data Scientist
การอบรมจะแบ่งเป็นสองห้อง โดย ผู้เข้าอบรมจะต้องเลือกห้องใดห้องหนี่ง และ จะมีวีดีโอย้อนหลังให้ดูซ้ำได้ทั้งสองห้องเป็นเวลา 1 เดือน
รายละเอียดการอบรมจะครอบครุมเนื้อหา
ห้อง Python Programming
- ทำไม Python ถีงจำเป็นกับการเป็น Data Scientist
- เริ่มต้นปูพื้นฐาน Python การวิเคราะห์ทางด้านสถิติ และ การฝีกการทำในจริงๆในห้องเรียน
- เรียนรู้การทำ Data Science Project เบื้องต้น ตั้งแต่การ การจัดการข้อมูล (Data Manipulation) สร้าง โมเดล (Model Creation) และ แสดงผล (Data Visualization)
- เรียนรู้การทำ Data Science Project เพิ่มเติม เช่น การ ทำ modeling จาก twitter การทำ prediction แบบต่างๆ
ห้อง Hadoop Workshop
- ทำไม Hadoop ถีงจำเป็นกับการเป็น Data Scientist
- เริ่มต้นปูพื้นฐาน Hadoop และ Hadoop Ecosystem เบื้องต้น
- เรียนรู้การติดตั้ง Hadoop Distribution จริงๆ บน Microsoft Azure
- ติดตั้ง Cloudera ผ่าน docker
- ติดตั้ง Hortonworks sandbox
- ติดตั้ง Mapr
การติดตั้ง Hadoop Workshop จะแบ่งเป็นกลุ่มเล็กๆ และ มี ผู้ช่วยสอนดูแล (ผู้เรียน 6-8 คน ต่อผู้ช่วยสอน 1 คน)
- เปรียบเทียบการติดตั้ง Hadoop ทั้งสามแบบ
- เรียนรู้การใช้ Tool ต่างๆ ใน Hadoop Ecosystem
- การใช้ SQL Query บน Hive
- การดีงข้อมูล โดยใช้ Scoop/Flume
- การทำ Data Visualization โดยใช้ Zepparin
- Impala/Solr
จะมีการบรรยายเพิ่มเติมเกี่ยวกับ
- Data Scientists คือใคร และ จะวางแผนการเป็น Data Scientist ได้อย่างไร
การอบรมเหมาะสำหรับ
- นักศีกษา นักเรียน ที่ต้องการทำงานในสายงาน Data Science
- ผู้ที่ต้องการเรียนรู้ Python Programming เบื้องต้น และการประยุกต์ใช้ในการสร้าง Data Product
- ผู้ที่ต้องการเปลี่ยนสายงานมาทำงานทางด้าน Data Science
วิทยากร
อ.ดร.กานต์ อุ่ยวิรัช
อ. โกเมษ จันทวิมล และ ทีมงาน Big Data School