Phân tích dữ liệu
Chương trình GCC nhắm đến 2 đối tượng chính là:
- Các sinh viên đang học các ngành nghề có liên quan đến công nghệ Số.
- Người đang tìm việc có nhu cầu bổ sung kiến thức về công nghệ Số mới để phát triển kỹ năng nghề nghiệp của mình.
Ngoài ra khóa học cũng sẽ dành cho các giảng viên của các trường và nhân viên tại các công ty có nhu cầu tìm hiểu và tiếp thu thêm kiến thức về công nghệ Số.
Google - Courses
-
-:
-
Phân tích mạng lưới:
-
Phân tích xu hướng, NLP:
- Các công cụ lắng nghe xã hội có sẵn giống như một ảnh chụp màn hình nhanh về những gì đang diễn ra
- Gensim tập trung vào mô hình chủ đề
- Feature Extraction, Text Representation, Text Extraction, Text Vectorization là những cái tên khác nhau cho cùng một thứ
- Không giám sát nghĩa là giả định rằng người huấn luyện không có giả định nào
- Bản chất của mô hình chủ đề là tô màu cho văn bản và từ
- Mô hình bản chất là một phép biến đổi không gian vector
- Mô hình chủ đề rất hữu dụng cho việc diễn giải
- SVD ban đầu là để tìm ra một phép xoay không gian mà vẫn giữ nguyên tích vô hướng của các vector
- tf-idf giúp xác định độ quan trọng của một từ trong một văn bản trong bộ văn bản
- tf-idf mạnh hơn count vector
- Mô hình trích chọn từ
- Phân tích xu hướng, NLP
- Tổng quan về mô hình chủ đề
- Tổng quan về xử lý tiếng Việt
- Bộ từ trong dictionary sẽ quyết định bộ vector
- Túi từ không phân biệt được những câu có cùng các từ bởi nó không phân biệt thứ tự trước sau của các từ trong một câu
- Việc biểu diễn các từ dưới dạng các vector one-hot chỉ đáp ứng được khả năng huấn luyện mà chưa phản ảnh được mối liên hệ về mặt ngữ nghĩa của các từ
- Việc vector hoá các văn bản là để máy tính có thể xử lý được
- Độ tương đồng của hai vector chính là tích vô hướng vừa nó
- Về mặt toán học thì AI không có gì thú vị. Việc thay đổi trọng số thú vị hơn
- Xử lý ngôn ngữ tự nhiên chính là một công cụ nghĩ
-
Toán:
- Nếu xem ma trận giống như dãy số thì cũng giống như xem sách giống như dãy chữ
- Phép cộng và phép nhân thể hiện sức mạnh của dữ liệu. Phép trừ và phép chia thể hiện tương quan dữ liệu
- Khi các xác suất độc lập với nhau thì dùng phép nhân
- Phương sai là để biết mức độ phân tán của dữ liệu so với giá trị trung bình