Machine Learning là gì
- warmsmiles81geomat
- Dec 3, 2020
- 6 min read
Hãy cùng xem Machine Learning là gì và nó hoạt động ra sao...

Machine Learning là gì?
Học máy là nghiên cứu các thuật toán máy tính cải tiến tự động thông qua trải nghiệm. Đó là một quá trình dạy một hệ thống máy tính cách đưa ra các dự đoán chính xác khi được cung cấp dữ liệu. Nó được xem như một tập hợp con của Trí tuệ nhân tạo (AI).
Nói một cách đơn giản, ML là một ứng dụng của AI. Nó cho phép các ứng dụng phần mềm trở nên chính xác hơn trong việc dự đoán kết quả mà không cần được lập trình rõ ràng để làm như vậy. Bằng cách sử dụng các thuật toán học máy, chúng ta có thể dự đoán rất nhiều thứ trên thế giới, bởi vì các thuật toán học máy sử dụng dữ liệu lịch sử làm đầu vào để dự đoán các giá trị đầu ra mới.
Sự khác nhau giữa AI và ML là gì?
Các hệ thống Trí tuệ nhân tạo (AI) thường sẽ thể hiện ít nhất một số đặc điểm này. Đó là lập kế hoạch, học tập, lý luận, giải quyết vấn đề, biểu diễn tri thức, nhận thức, chuyển động và vận dụng và ở mức độ thấp hơn là trí tuệ xã hội và sự sáng tạo. Và bên kia Học máy (ML), có nhiều cách tiếp cận khác được sử dụng để xây dựng các hệ thống AI, bao gồm tính toán tiến hóa, trong đó các thuật toán trải qua các đột biến và kết hợp ngẫu nhiên giữa các thế hệ nhằm cố gắng “phát triển” các giải pháp tối ưu và hệ thống chuyên gia, nơi máy tính được lập trình với các quy tắc cho phép họ bắt chước hành vi của một chuyên gia con người trong một lĩnh vực cụ thể, ví dụ hệ thống lái tự động lái máy bay
Các kiểu ML
Nói chung, Học máy được chia thành bốn loại. Nó được phân loại theo cách một thuật toán học để trở nên chính xác hơn trong các dự đoán của nó. Những loại đó là,
1. Supervised Learning
2. Unsupervised Learning
3. Semi-supervised Learning
4. Reinforcement Learning
Loại thuật toán mà nhà khoa học dữ liệu chọn sử dụng phụ thuộc vào loại dữ liệu họ muốn dự đoán.
Supervised Learning là gì ?
Học tập có giám sát là khi mô hình được đào tạo trên một tập dữ liệu được gắn nhãn. Tập dữ liệu được gắn nhãn là tập dữ liệu có cả tham số đầu vào và đầu ra. Đào tạo cho việc học có giám sát, các hệ thống được tiếp xúc với lượng lớn dữ liệu được dán nhãn. Các nhà khoa học dữ liệu cung cấp các thuật toán với dữ liệu đào tạo được gắn nhãn và xác định các biến mà họ muốn thuật toán đánh giá cho các mối tương quan. Cả đầu vào và đầu ra của thuật toán đều được chỉ định.

Supervised Learning
Supervised Learning hoạt động ra sao?
Học máy được giám sát yêu cầu đào tạo thuật toán với cả đầu vào được gắn nhãn và đầu ra mong muốn. Các thuật toán học tập có giám sát rất tốt cho các tác vụ sau,
Phân loại nhị phân (Binary classification) - Để chia dữ liệu thành hai loại.
Phân loại nhiều lớp (Multi-class classification) - Để chọn giữa nhiều hơn hai loại câu trả lời.
Mô hình hồi quy (Regression modeling) - Để dự đoán các giá trị liên tục.
Kết hợp (Ensembling) - Để kết hợp các dự đoán của nhiều mô hình học máy để tạo ra dự đoán chính xác.
Unsupervised Learning là gì ?
Trong Học không giám sát, thuật toán được sử dụng để rút ra các suy luận từ tập dữ liệu bao gồm dữ liệu đầu vào mà không có phản hồi được gắn nhãn. Ở đây, chúng tôi sử dụng các thuật toán với việc xác định các mẫu trong dữ liệu, cố gắng phát hiện các điểm tương đồng để chia dữ liệu đó thành các danh mục.

Unsupervised Learning
Unsupervised Learning hoạt động ra sao?
Các thuật toán học máy không giám sát không yêu cầu dữ liệu phải được gắn nhãn. Họ sàng lọc dữ liệu không được gắn nhãn để tìm kiếm các mẫu có thể được sử dụng để nhóm các điểm dữ liệu thành các tập hợp con.
Hầu hết các loại học sâu, bao gồm cả mạng nơ-ron, là các thuật toán không được giám sát. Các thuật toán học tập không giám sát tốt cho các tác vụ sau:
Phân cụm (Clustering) - Để chia tập dữ liệu thành các nhóm dựa trên sự giống nhau của dữ liệu.
Phát hiện bất thường (Anomaly detection) - Để xác định các điểm dữ liệu bất thường trong tập dữ liệu.
Khai phá liên kết (Association mining) - Để xác định các tập hợp các mục trong tập dữ liệu thường xuyên xảy ra cùng nhau.
Giảm chiều (Dimensionality Reduction) - Để giảm số lượng biến trong tập dữ liệu.
Semi-supervised Learning là gì ?
Trong Học tập bán giám sát bao gồm sự kết hợp của hai loại trước. Kỹ thuật này dựa vào việc sử dụng một lượng nhỏ dữ liệu được gắn nhãn và một lượng lớn dữ liệu chưa được gắn nhãn để huấn luyện hệ thống. Dữ liệu được gắn nhãn được sử dụng để đào tạo một phần mô hình học máy và sau đó mô hình được đào tạo một phần đó được sử dụng để gắn nhãn cho dữ liệu chưa được gắn nhãn, một quá trình gọi là gắn nhãn giả. Sau đó, mô hình được đào tạo dựa trên sự kết hợp kết quả của dữ liệu được gắn nhãn và được gắn nhãn giả.
Semi-supervised learning hoạt động ra sao
Học bán giám sát hoạt động bằng cách cung cấp một lượng nhỏ dữ liệu đào tạo được gắn nhãn cho một thuật toán. Hiệu suất của các thuật toán thường được cải thiện khi chúng đào tạo trên các tập dữ liệu được gắn nhãn. Học tập bán giám sát đặt nền tảng giữa hiệu suất của học tập có giám sát và hiệu quả của học tập không giám sát. Một số lĩnh vực sử dụng phương pháp học bán giám sát bao gồm:
Dịch máy (Machine learning translation) - Để dạy các thuật toán dịch ngôn ngữ dựa trên ít hơn một từ điển đầy đủ các từ.
Phát hiện gian lận (Fraud detection) - Để xác định các trường hợp gian lận khi bạn chỉ có một vài ví dụ tích cực.
Gắn nhãn dữ liệu (Labeling data ) - Để huấn luyện các thuật toán trên tập dữ liệu nhỏ có thể học cách áp dụng nhãn dữ liệu cho các tập lớn hơn một cách tự động.
Reinforcement Learning là gì ?
Điều này không giống như học máy không có giám sát và có giám sát, học tăng cường không dựa trên tập dữ liệu tĩnh. Nó hoạt động trong một môi trường năng động và học hỏi từ những kinh nghiệm thu thập được. Điểm dữ liệu hoặc kinh nghiệm được thu thập trong quá trình đào tạo thông qua các tương tác thử-và-sai giữa môi trường và tác nhân phần mềm. Khía cạnh này của việc học tăng cường rất quan trọng, vì nó làm giảm bớt nhu cầu thu thập dữ liệu, xử lý trước và dán nhãn trước khi đào tạo, nếu không thì cần thiết trong việc học có giám sát và không giám sát.

Reinforcement Learning
Reinforcement learning hoạt động ra sao
Học củng cố hoạt động bằng cách lập trình một thuật toán với một mục tiêu riêng biệt và một bộ quy tắc được chỉ định để đạt được mục tiêu đó. Học tập củng cố thường được sử dụng trong các lĩnh vực như,
Robot (Robotics) - Robot có thể học cách thực hiện các nhiệm vụ trong thế giới vật chất bằng kỹ thuật này.
Trò chơi video (Video gameplay ) - Học tăng cường đã được sử dụng để dạy bot chơi một số trò chơi điện tử.
Quản lý tài nguyên (Resource management) - Có nguồn lực hữu hạn và một mục tiêu xác định.
Ứng dụng của ML
Ngày nay, hầu hết thời gian chúng ta đang sử dụng máy học trong cuộc sống hàng ngày của mình ngay cả khi không biết. Chẳng hạn như bản đồ Google, trợ lý Google, Alexa, Siri, v.v. Và nó đang phát triển rất nhanh chóng từng ngày.

Most trending real world applications of Machine learning
Học máy có thể giúp doanh nghiệp hiểu khách hàng của họ ở mức độ sâu hơn. Bằng cách thu thập dữ liệu khách hàng và tương quan nó với các hành vi theo thời gian, các thuật toán học máy có thể tìm hiểu các liên kết và giúp các nhóm điều chỉnh các sáng kiến tiếp thị và phát triển sản phẩm theo nhu cầu của khách hàng. Giống như khôn ngoan, hầu hết thời gian nó hoạt động dễ dàng hơn.
Nguồn: medium.com
Yorumlar