🔥 สวัสดีทุกคน วันนี้แอดจะพาเพื่อน ๆ มารู้จักกับการทำ One-Hot Encoding ใน Machine Learning กันนน มีรายละเอียดยังไงบ้างนั้น ไปดูกันเลยจ้าาา
.
👉 One-Hot Encoding คือการทำข้อมูลที่เป็น Categorical ทั้งในรูปแบบมีลำดับ (Ordinal number) และไม่มีลำดับ (Nominal number) เปลี่ยนให้อยู่ในรูปแบบของ Binary Values ที่มีค่า 0 หรือ 1 ทำให้ง่ายต่อการนำข้อมูลไปใช้ต่อยอดกับ Machine Learning
.
🌈 get_dummies() จะทำการสร้าง df ขึ้นมาใหม่ตามรูปแบบของข้อมูลใน Column นั้น จากตัวอย่าง ข้อมูล Grade ของแต่ละคน มีรูปแบบข้อมูลเป็น F, C, A, B+ จึงทำให้ dummies มี Colum อยู่แค่ 4 ตัวนั่นเอง
.
borntoDev - 🦖 สร้างการเรียนรู้ที่ดีสำหรับสายไอทีในทุกวัน
encoding machine learning 在 โปรแกรมเมอร์ไทย Thai programmer Facebook 的最佳貼文
transcompiler ก็คือตัวแปรภาษา ระดับโค้ดสู่โค้ด 🤓
โดยแปลงภาษาเขียนโปรแกรม
จากภาษาระดับสูง ไปเป็นภาษาระดับสูงอีกภาษาหนึ่ง
เช่นโค้ดจาก Python กลายเป็นโค้ด C++
โค้ดจาก Java กลายเป็น Kotlin เป็นต้น
.
transcompiler จะต่างกับ compiler แบบดั้งเดิม
เพราะ compiler แบบเดิม
ที่แปลจากภาษาระดับสูงไปเป็นภาษาระดับต่ำ (assembly)
แต่กรณีคือโค้ดภาษาระดับสูงสู่ โค้ดภาษาระดับสูงด้วยกัน
.
ในตอนนี้เราสามารถใช้ transcompiler
ที่เบื้องหลังคือ AI ให้ทำการแปลงโค้ดให้ได้นะ
มันเป็นผลงานวิจัยของทีม facebook เกี่ยวกับ AI ล่าสุดเลย
ศาสตร์ที่ใช้คือ deep learning
.
เทคนิคที่ใช้
✔ โมเดลแบบ sequence-to-sequence (seq2seq) ด้วย attention
✔ เทรนโดยใช้แนวทาง unsupervised machine translation ตามที่งานวิจัยเสนอซึ่งมี 3 ขั้นตอนได้แก่
- Cross-lingual Masked Language Model pretraining
- Denoising auto-encoding
- Back-translation
✔ data set ที่ใช้ เทรน เป็นโค้ดของ github
.
.
ตามรูปที่เห็นในโพสต์จะเห็นว่า
✔ โค้ดในภาษา python ได้ประกาศฟังก์ชั่น SumOfKsubArray
แล้วได้ถูกแปลงเป็นโค้ดในภาษา C++ ได้อย่างทึ่ง
✔ อย่าง deque() ถูกแปลงเป็น deque
แล้วแปลงการเรียกใช้ [] ใน python ให้เป็นการเรียกฟังก์ชั่น front, back, pop_back และ push_back ในภาษา C++
✔ แปลงการใช้ประโยค for loop ไสตล์ python ไปเป็น for loop ในภาษา C++
.
.
สนใจก็ไปอ่านวิจัยของทีม facebook ได้ที่นี้
https://arxiv.org/abs/2006.03511
.
.
.
.
.
+++++ขั่วโมงขายของ++++
สำหรับใครที่ไม่อยากตกเทรนเรื่อง AI
😻 ก็จะแนะนำหนังสือขายดี "AI ไม่ยาก เรียนรู้ด้วยเลขม. ปลาย"
ไม่ต้องมีความรู้เรื่องโค้ดดิ้ง ขอให้มีพื้นฐานเลข ม. ปลาย ก็อ่านได้
ก็สั่งซื้อ ebook ได้ที่นี้ (ขออภัยยังไม่มีเล่มกระดาษขาย)
👉 https://www.mebmarket.com/web/index.php?action=BookDetails&data=YToyOntzOjc6InVzZXJfaWQiO3M6NzoiMTcyNTQ4MyI7czo3OiJib29rX2lkIjtzOjY6IjEwODI0NiI7fQ
.
ส่วนตัวอย่างหนังสือ ก็ดูได้ที่
👉 https://drive.google.com/file/d/1zG64QAuPKtnWu-Jizn4i2JYUbHnHa8cJ/view?usp=sharing
.
ราคาขาย 295 บาท ฿
แต่ถ้าซื้อผ่านระบบของ Apple จะแพงขึ้น ราคา 329 บาท ฿
วิธีอ่าน อ่านผ่านแอพหรือโปรแกรมเท่านั้น
.
✍ เขียนโดย โปรแกรมเมอร์ไทย thai programmer
encoding machine learning 在 軟體開發學習資訊分享 Facebook 的最佳解答
如果你對資料科學、演算法交易、機器人技術或任何人力被機器取代的行業感興趣,那麼你來對地方了!
從這 6 小時的課程,你會學到
✅獲取資料科學家在他們的工作所需的最重要的技能 – 機器學習
✅親身體驗第一手在大量資料尋找複雜關係的無與倫比的滿意結果
✅以 Python 應用 NumPy 和 TensorFlow 創建機器學習演算法
✅做大數據程式設計和任務解決時,發展商業直覺
✅全面了解 TensorFlow – Google 的尖端機器學習框架
✅將機器學習應用於一個真實的案例,有真實的人群、真實的資料和真實的洞見,幫助企業優化其行銷工作
✅獲得公司在雇用資料科學家時尋找的技能
✅從非常基礎 – 資料、模型、目標函數和優化演算法開始
深入了解機器學習過程
✅經由我們的課程筆記,了解機器學習演算法背後的數學
✅從 NumPy 開始,轉移到 TensorFlow,從不同的角度看 ML 過程
✅從頭建構機器學習演算法
✅展現深層神經網路的力量
✅了解反向傳播 ( backpropagation )
✅逐漸學習更複雜的話題,比如:彌合不足或過度彌合、訓練、驗證、n-fold交叉驗證、測試、提早停止、初始化
✅了解像隨機梯度下降、批量、動量和學習率規劃等優化技術
✅應用你學習的每一個主題
✅用 Python 實踐機器學習功能
✅加快演算法
✅執行預處理 – 標準化、規範化和獨熱編碼 ( One-hot Encoding )
✅評估機器學習演算法的準確性
✅調節超參數以獲得更好的性能
https://softnshare.com/machine-learning-with-tensorflow-for-business-intelligence/