Education

Python/Hadoop for (Young) Data Scientists

Python/Hadoop for (Young) Data Scientists

การอบรม Python/Hadoop Programming สำหรับผู้ที่ต้องการเป็น (Young) Data Scientist

การอบรมจะแบ่งเป็นสองห้อง โดย ผู้เข้าอบรมจะต้องเลือกห้องใดห้องหนี่ง และ จะมีวีดีโอย้อนหลังให้ดูซ้ำได้ทั้งสองห้องเป็นเวลา 1 เดือน

รายละเอียดการอบรมจะครอบครุมเนื้อหา

ห้อง Python Programming

  • ทำไม Python ถีงจำเป็นกับการเป็น Data Scientist
  • เริ่มต้นปูพื้นฐาน Python การวิเคราะห์ทางด้านสถิติ และ การฝีกการทำในจริงๆในห้องเรียน
  • เรียนรู้การทำ Data Science Project เบื้องต้น ตั้งแต่การ การจัดการข้อมูล (Data Manipulation) สร้าง โมเดล (Model Creation) และ แสดงผล (Data Visualization)
  • เรียนรู้การทำ Data Science Project เพิ่มเติม เช่น การ ทำ modeling จาก twitter การทำ prediction แบบต่างๆ 

ห้อง Hadoop Workshop

  • ทำไม Hadoop ถีงจำเป็นกับการเป็น Data Scientist
  • เริ่มต้นปูพื้นฐาน Hadoop และ Hadoop Ecosystem เบื้องต้น 
  • เรียนรู้การติดตั้ง Hadoop Distribution จริงๆ บน Microsoft Azure 
  • ติดตั้ง Cloudera ผ่าน docker 
  • ติดตั้ง Hortonworks sandbox
  • ติดตั้ง Mapr

การติดตั้ง Hadoop Workshop จะแบ่งเป็นกลุ่มเล็กๆ และ มี ผู้ช่วยสอนดูแล (ผู้เรียน 6-8 คน ต่อผู้ช่วยสอน 1 คน)

  • เปรียบเทียบการติดตั้ง Hadoop ทั้งสามแบบ 
  • เรียนรู้การใช้ Tool ต่างๆ ใน Hadoop Ecosystem
  • การใช้ SQL Query บน Hive
  • การดีงข้อมูล โดยใช้ Scoop/Flume
  • การทำ Data Visualization โดยใช้ Zepparin
  • Impala/Solr

จะมีการบรรยายเพิ่มเติมเกี่ยวกับ

  • Data Scientists คือใคร และ จะวางแผนการเป็น Data Scientist ได้อย่างไร

การอบรมเหมาะสำหรับ

  • นักศีกษา นักเรียน ที่ต้องการทำงานในสายงาน Data Science
  • ผู้ที่ต้องการเรียนรู้ Python Programming เบื้องต้น และการประยุกต์ใช้ในการสร้าง Data Product
  • ผู้ที่ต้องการเปลี่ยนสายงานมาทำงานทางด้าน Data Science

วิทยากร

อ.ดร.กานต์ อุ่ยวิรัช

อ. โกเมษ จันทวิมล และ ทีมงาน Big Data School

B50458ce60bc3faf29985aa35be1cd811d17441e
จัดโดย
Data Science Thailand