Ngành khoa học dữ liệu thực ra chỉ nổi lên trong khoảng 10 năm trở lại đây. Trước đó, việc đưa ra các quyết định dựa trên số liệu thì không phải là mới, chỉ là không được gọi là “khoa học dữ liệu” mà thôi. Nhưng cũng vì “mới” quá nên nhiều bạn chưa hoặc vừa bước chân vào ngành này gặp khó khăn khi định hướng mục tiêu nghề nghiệp của mình. Chính vì vậy, mình viết bài này để giới thiệu qua một số công việc phổ biến trong khoa học dữ liệu, hy vọng có thể giúp các bạn có cái nhìn rõ ràng hơn.
Chuyên viên phân tích (Data Analyst)
Chuyên viên phân tích có trách nhiệm phân tích dữ liệu với mục tiêu giúp doanh nghiệp theo dõi tiến độ kinh doanh và chỉ ra những vấn đề cần được cải thiện trong các mảng khác nhau như quảng cáo, bán hàng, vận hành,… Công việc chính sẽ xoay quanh việc lấy dữ liệu, phân tích và vẽ đồ thị hoặc tạo bảng giao diện số (dashboards).
Một số ví dụ về công việc của chuyên viên phân tích:
- Lập báo cáo về kết quả bán hàng của doanh nghiệp trong 6 tháng đầu năm để tìm ra nhóm sản phẩm bán chạy nhất và kém nhất.
- Tạo bảng giao diện số để theo dõi hiệu quả của các kênh quảng cáo khác nhau (báo chí, truyền hình, mạng xã hội,…).
Một số công việc tương tự: Business Analyst (chuyên viên phân tích kinh doanh), Business Intelligence (tạm dịch: chuyên viên trí tuệ doanh nghiệp).
Kỹ sư dữ liệu (Data Engineer)
Kỹ sư dữ liệu có trách nhiệm xây dựng và tối ưu hóa hệ thống để quản dữ liệu. Vai trò này giúp đơn giản hóa việc lấy dữ liệu để phân tích, và đảm bảo sự tích hợp dữ liệu với những hệ thống khác.
Nhiều doanh nghiệp có lượng dữ liệu lớn, đa dạng, và từ nhiều nguồn khác nhau. Khi đó, việc lấy dữ liệu về nghe không khó mà khó không tưởng đối với những người chưa có một số kỹ năng như làm việc với cơ sở dữ liệu, viết giao diện lập trình ứng dụng,… Vì vậy, mình thấy vai trò của kỹ sư dữ liệu rất cần thiết.
Nhà khoa học dữ liệu (Data Scientist)
Nhà khoa học dữ liệu có vai trò khá giống với chuyên viên phân tích. Họ cũng cần phải lấy dữ liệu, phân tích và làm báo cáo để tìm ra những thông tin hữu ích từ dữ liệu. Điểm khác biệt lớn nhất có lẽ là nhà khoa học dữ liệu có thể phân tích sâu hơn bằng lý thuyết thống kê và mô hình học máy. Bên cạnh đó, nhà khoa học dữ liệu có thể có thể tham gia vào việc phát triển hệ thống trí tuệ nhân tạo (AI systems) trong doanh nghiệp.
Một số ví dụ về công việc của nhà khoa học dữ liệu:
- Lập báo cáo về những yếu tố chính ảnh hưởng đến việc quyết định mua sản phẩm, từ đó phát triển chiến lược quảng cáo phù hợp cho từng khách hàng.
- Phát triển hệ thống gợi ý các sản phẩm cho người dùng (recommendation system).
Kỹ sư học máy (Machine Learning Engineer)
Kỹ sư học máy tập trung vào việc tích hợp mô hình học máy và những hệ thống khác với mục tiêu phát triển AI systems.
Ví dụ như hệ thống gợi ý sản phẩm ở một sàn thương mại điện tử không chỉ có mô hình học máy mà còn cần tích hợp với một số thành phần khác như hệ thống quản lý khách hàng, hệ thống quản lý kho,… Công việc tích hợp hệ thống này sẽ được thực hiện bởi kỹ sư học máy.
Tạm kết
Tóm lại, mỗi công việc trong ngành khoa học dữ liệu sẽ tập trung vào xây dựng và phát triển một sản phẩm nhất định. Nhưng nhìn chung, dù công việc là gì thì đều xoay quanh việc tạo ra các sản phẩm từ dữ liệu với mục tiêu mang lại giá trị cho doanh nghiệp. Hình dưới đây là cái nhìn khái quát (theo quan điểm của mình) về mối liên hệ giữa các công việc trong ngành này:
Trên thực tế, khoa học dữ liệu là một ngành mới, các công việc trong đó cũng chưa được định nghĩa rõ ràng nên rất dễ nhầm lẫn với nhau. Mình đã từng thấy tin tuyển dụng cho nhà khoa học dữ liệu nhưng mô tả công việc lại nghiêng về chuyên viên phân tích hơn, hoặc tin tuyển dụng cho kỹ sư dữ liệu nhưng mô tả công việc lại giống kỹ sư học máy hơn. Chính vì chuyện “râu ông nọ cắm cằm bà kia” như vậy khá phổ biến, khi nộp đơn xin việc, các bạn không nên quá chú trọng vào tên công việc (job title) mà nên đọc kỹ mô tả công việc (job description) xem nó yêu cầu làm gì, đòi hỏi kỹ năng gì, có phù hợp với định hướng nghề nghiệp của các bạn không.
P/S: Nếu các bạn có thắc mắc gì về cơ hội nghề nghiệp trong lĩnh vực khoa học dữ liệu cứ comment ở dưới nhé 😉
Leave a comment