Cùng với sự phát triển của xã hội, con người ngày càng sử dụng nhiều thông tin để giao tiếp cũng như phục vụ xử lý công việc, hoạt động giải trí. Những thông tin được thu thập và lưu trữ trong máy tính thành các dữ liệu. Có thể nói, ngày nay là sự bùng nổ của thông tin và dữ liệu. Dữ liệu ngày nay vô cùng phức tạp, một số dữ liệu được cấu trúc và lưu trữ trong cơ sở dữ liệu quan hệ truyền thống, trong khi các dữ liệu khác như tài liệu, hồ sơ khách hàng và thậm chí cả hình ảnh và video là không có cấu trúc. Một số dữ liệu khác đến từ các nguồn khác như dữ liệu từ phương tiện truyền thông xã hội và dữ liệu được tạo từ các tương tác trang web, dữ liệu từ các thiết bị di động và từ các cảm biến, thiết bị thông minh.
Tri thức là các mối liên hệ giữa các dữ liệu, trong dữ liệu luôn tồn tại tri thức, mặc dù có thể chúng ta chưa phát hiện được chúng. Khai phá dữ liệu là một bước trong quá trình phát hiện tri thức có ích từ lượng lớn dữ liệu, những dữ liệu này có thể từ kho dữ liệu, web, hoặc các nguồn dữ liệu khác. Việc khai thác, chiết lọc thông tin ứng dụng vào cuộc sống của con người không chỉ dừng lại là một kĩ thuật đơn thuần, nó đòi hỏi sự ra đời của ngành khoa học mới: Phát hiện tri thức và Khai phá dữ liệu (Knowledge Discovery and Data Mining - KDD).
Qua môn học Khai phá dữ liệu và Phát hiện tri thức do thầy Trần Chí Kiên giảng dạy, em đã phần nào hiểu được những khái niệm cơ bản, tổng quan về các kỹ thuật, phương pháp khai phá dữ liệu và phát hiện tri thức. Kết thúc môn học, em đã được giao đề tài “Sắp xếp các gian hàng bằng luật kết hợp và thuật toán Apriori” để nghiên cứu và làm báo cáo bài tập lớn kết thúc môn học.
Em xin cảm ơn sâu sắc nhà trường, và thầy Trần Chí Kiên đã giúp đỡ và cho em có thêm những kiến thức mới, hiện đại, bổ ích để phục vụ công tác chuyên môn.