Phân tích dữ liệu
Chương trình GCC nhắm đến 2 đối tượng chính là:
- Các sinh viên đang học các ngành nghề có liên quan đến công nghệ Số.
- Người đang tìm việc có nhu cầu bổ sung kiến thức về công nghệ Số mới để phát triển kỹ năng nghề nghiệp của mình.
Ngoài ra khóa học cũng sẽ dành cho các giảng viên của các trường và nhân viên tại các công ty có nhu cầu tìm hiểu và tiếp thu thêm kiến thức về công nghệ Số.
Google - Courses
-
-:
-
Mạng thần kinh:
-
Phân tích xu hướng, NLP:
- Các công cụ lắng nghe xã hội có sẵn giống như một ảnh chụp màn hình nhanh về những gì đang diễn ra
- Feature Extraction, Text Representation, Text Extraction, Text Vectorization là những cái tên khác nhau cho cùng một thứ
- Gensim tập trung vào mô hình chủ đề
- Không giám sát nghĩa là giả định rằng người huấn luyện không có giả định nào
- Bản chất của mô hình chủ đề là tô màu cho văn bản và từ
- Mô hình bản chất là một phép biến đổi không gian vector
- Mô hình chủ đề rất hữu dụng cho việc diễn giải
- SVD ban đầu là để tìm ra một phép xoay không gian mà vẫn giữ nguyên tích vô hướng của các vector
- tf-idf giúp xác định độ quan trọng của một từ trong một văn bản trong bộ văn bản
- tf-idf mạnh hơn count vector
- Mô hình trích chọn từ
- Phân tích xu hướng, NLP
- Tổng quan về mô hình chủ đề
- Tổng quan về xử lý tiếng Việt
- Bộ từ trong dictionary sẽ quyết định bộ vector
- Túi từ không phân biệt được những câu có cùng các từ bởi nó không phân biệt thứ tự trước sau của các từ trong một câu
- Việc biểu diễn các từ dưới dạng các vector one-hot chỉ đáp ứng được khả năng huấn luyện mà chưa phản ảnh được mối liên hệ về mặt ngữ nghĩa của các từ
- Việc vector hoá các văn bản là để máy tính có thể xử lý được
- Độ tương đồng của hai vector chính là tích vô hướng vừa nó
- Về mặt toán học thì AI không có gì thú vị. Việc thay đổi trọng số thú vị hơn
- Code chạy trên Linux hoặc WSL
- Collection là những sản phẩm đầu ra, bao gồm các mô hình chủ đề và minh hoạ tương tác có thể dùng trực tiếp
- Diễn giải mô hình WhatEvery1Says
- Xử lý ngôn ngữ tự nhiên chính là một công cụ nghĩ