Phân tích dữ liệu
Chương trình GCC nhắm đến 2 đối tượng chính là:
- Các sinh viên đang học các ngành nghề có liên quan đến công nghệ Số.
- Người đang tìm việc có nhu cầu bổ sung kiến thức về công nghệ Số mới để phát triển kỹ năng nghề nghiệp của mình.
Ngoài ra khóa học cũng sẽ dành cho các giảng viên của các trường và nhân viên tại các công ty có nhu cầu tìm hiểu và tiếp thu thêm kiến thức về công nghệ Số.
Google - Courses
-
-:
-
Mạng thần kinh:
-
Phân tích mạng lưới:
-
Phân tích xu hướng, NLP:
- Feature Extraction, Text Representation, Text Extraction, Text Vectorization là những cái tên khác nhau cho cùng một thứ
- Gensim tập trung vào mô hình chủ đề
- Các công cụ lắng nghe xã hội có sẵn giống như một ảnh chụp màn hình nhanh về những gì đang diễn ra
- Không giám sát nghĩa là giả định rằng người huấn luyện không có giả định nào
- Mô hình bản chất là một phép biến đổi không gian vector
- Bản chất của mô hình chủ đề là tô màu cho văn bản và từ
- Mô hình chủ đề rất hữu dụng cho việc diễn giải
- SVD ban đầu là để tìm ra một phép xoay không gian mà vẫn giữ nguyên tích vô hướng của các vector
- tf-idf mạnh hơn count vector
- tf-idf giúp xác định độ quan trọng của một từ trong một văn bản trong bộ văn bản
- Phân tích xu hướng, NLP
- Tổng quan về mô hình chủ đề
- Tổng quan về xử lý tiếng Việt
- Mô hình trích chọn từ
- Bộ từ trong dictionary sẽ quyết định bộ vector
- Túi từ không phân biệt được những câu có cùng các từ bởi nó không phân biệt thứ tự trước sau của các từ trong một câu
- Việc biểu diễn các từ dưới dạng các vector one-hot chỉ đáp ứng được khả năng huấn luyện mà chưa phản ảnh được mối liên hệ về mặt ngữ nghĩa của các từ
- Việc vector hoá các văn bản là để máy tính có thể xử lý được
- Độ tương đồng của hai vector chính là tích vô hướng vừa nó
- Về mặt toán học thì AI không có gì thú vị. Việc thay đổi trọng số thú vị hơn
- Xử lý ngôn ngữ tự nhiên chính là một công cụ nghĩ
- Code chạy trên Linux hoặc WSL
- Collection là những sản phẩm đầu ra, bao gồm các mô hình chủ đề và minh hoạ tương tác có thể dùng trực tiếp
- Diễn giải mô hình WhatEvery1Says
-
Toán:
- Hệ mã đối xứng dùng chung khoá cho cả lúc mã hoá và giải mã. Hệ mã bất đối xứng có khoá để mã hoá và giải mã khác nhau
- Nếu xem ma trận giống như dãy số thì cũng giống như xem sách giống như dãy chữ
- Phép cộng và phép nhân thể hiện sức mạnh của dữ liệu. Phép trừ và phép chia thể hiện tương quan dữ liệu
- Việc xử lý toán cho việc xử lý đồ hoạ, cơ học chất lỏng, và AI là khá giống nhau
- Khi các xác suất độc lập với nhau thì dùng phép nhân
- A p value is not how likely you think the alternative hypothesis is to be true. It’s how likely you think the result would have been if it were false
- Phương sai được chuộng dùng hơn độ lệch chuẩn vì nó dễ tính hơn
- Phương sai, độ lệch chuẩn là để biết mức độ phân tán của dữ liệu so với giá trị trung bình
- Độ lệch chuẩn có chữ chuẩn trong tên vì nó dùng đúng đơn vị đo. Phương sai có nghĩa là độ lệch được bình phương.