Nếu xem ma trận giống như dãy số thì cũng giống như xem sách giống như dãy chữ Nguồn:: The Attention Mechanism in Large Language Models - YouTube