Data Mining là một thuật ngữ và mang tính chuyên ngành dành cho các bác chiên gia xử lý những kho dữ liệu lớn và không phải là cái gì phổ dụng để tất cả chúng ta cần phải biết. Đối với các chuyên gia thì trích dẫn thuật ngữ "
Data Mining" sẽ có tính chất biểu cảm hơn nhiều là việc dùng một cụm thuần việt. Vụ đó tôi thấy khá bình thường. Nhưng nếu cứ thỉnh thoảng nói surf web, download hoặc post .... thì cũng kém mỹ quan.
Việc ai đó có cơ hội động chạm đến dữ liệu với vài chục triệu dòng thì phải nói là người đấy được cấp quyền hơi cao rồi vì thế bác VietMini mới phỏng đoán như vậy. Và với quyền quản lý, truy cập cao như vậy với kho dữ liệu đó thì nghiệp vụ phân tích, quản trị data của bác đó cũng cao lắm chứ mèng gì mấy vụ SQL đơn giản.
Bản thân từ Data Mining chưa có một thuật ngữ tương đương thoát nghĩa trong tiếng Việt. Dịch thuần ra thì đơn giản là Khai phá/ khai thác dữ liệu. Từ Mining có nghĩa là đào mỏ, khai mỏ, khai thác...
Nhưng dịch sang như vậy nó không hoàn toàn đúng với cách định nghĩa gốc trong tiếng Tây.
Trích dẫn định nghĩa như thế này:
"Generally, data mining (sometimes called data or knowledge discovery) is the process of analyzing data from different perspectives and summarizing it into useful information - information that can be used to increase revenue, cuts costs, or both. Data mining software is one of a number of analytical tools for analyzing data. It allows users to analyze data from many different dimensions or angles, categorize it, and summarize the relationships identified. Technically, data mining is the process of finding correlations or patterns among dozens of fields in large relational databases."
http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm
Tạm dịch thế này
Nói chung Khai phá dữ liệu (thỉnh thoảng người ta còn gọi là khám phá dữ liệu hoặc tri thức) là một quá trình phân tích dữ liệu theo các khía cạnh khác nhau và tóm tắt lại thành các thông tin hữu ích - những thông tin có thể dùng để tăng doanh thu, giảm giá thành hoặc cả hai. Phần mềm khai phá dữ liệu là một nhóm các công cụ phân tích dữ liệu. Chúng cho phép người dùng phân tích số liệu theo các chiều hoặc góc nhìn khác nhau, phân loại, tổ hợp,tóm tắt các mối quan hệ xác định được. Về mặt kỹ thuật, đây là quá trình tìm các mối liên hệ hoặc các dấu hiệu mang tính quy tắc từ hàng chục trường dữ liệu trong các cơ sở dữ liệu lớn.
Túm lại, với một người làm liên quan đến số liệu, không phải lúc nào anh ta cũng được phép tiếp cận với những kho dữ liệu lớn. Nếu ai đó được quyền khai thác, sử dụng số liệu cỡ lớn như vậy, anh ta phải có kiến thức hoặc được quyền truy cập hoặc ít ra là có quyền truy vấn những chuyên gia trong ngành (chẳng hạn lãnh đạo yêu cầu nhân viên chẳng hạn).
Vì vậy, xem phép được múa mấy dòng thô kệch! Nếu các bạn muốn hiểu kỹ về Data mining, Data warehouse .. xin gúc gờ... sẽ rất thú vị.