Làm sao để trở thành nhà khoa học dữ liệu và chuyên gia phân tích dữ liệu

27/10/2016    14.154    4.07/5 trong 39 lượt 
Làm sao để trở thành nhà khoa học dữ liệu và chuyên gia phân tích dữ liệu
Chưa bao giờ các doanh nghiệp lại “khát” nhân lực về “Big Data” như hiện nay do ngày càng có nhiều công ty nhận ra được lợi ích to lớn từ việc khai thác và phân tích dữ liệu đối với hoạt động kinh doanh của họ. Theo phân tích trên thị trường việc làm thì họ được đón chào với mức lương hậu hĩnh cùng nhiều phụ cấp hấp dẫn khác cho công việc như Data scientist - nhà khoa học dữ liệu hay Data analyst - Chuyên gia phân tích dữ liệu. Vậy làm sao để trở thành nhà khoa học dữ liệu cũng như chuyên gia phân tích dữ liệu?
Hiện nay, thuật ngữ “nhà khoa học dữ liệu” và “chuyên gia phân tích dữ liệu” thường được các Marketer sử dụng thay thế cho nhau như thể họ là một và giống nhau. Chúng ta cùng cùng làm rõ 2 khái niệm này

Phân biệt Chuyên gia phân tích dữ liệu và Nhà khoa học dữ liệu

Chuyên gia phân tích dữ liệu

- Có thể cho rằng vai trò quan trọng nhất của một nhà phân tích dữ liệu đó là thu thập, phân loại và nghiên cứu các bộ thông tin khác nhau.
- Quá trình này có vẻ khác nhau tùy thuộc vào tổ chức, nhưng thường mục tiêu là để xác định giá trị cho một số quá trình hoặc chức năng để có thể được đánh giá và so sánh theo thời gian.
- Dữ liệu này được điều chỉnh và chuẩn hóa để có thể đưa ra khỏi ngữ cảnh và sử dụng như thông tin độc lập hoặc kết hợp với các dữ liệu khác mà không làm mất tính toàn vẹn của nó.
- Các chuyên gia phân tích thường được giao nhiệm vụ rút ra kết luận từ dữ liệu và giúp những người khác trong doanh nghiệp hiểu làm thế nào để sử dụng nó.
- Họ thường là những người hiểu rõ nhất cội nguồn và bản chất của các con số.

Nhà khoa học dữ liệu

- Các nhà khoa học dữ liệu đại diện cho một dạng phát triển từ vai trò của chuyên gia phân tích dữ liệu truyền thống hoặc phân tích kinh doanh.
- Họ có sự nhạy bén trong kinh doanh cùng với khả năng truyền đạt kết quả cho các nhà lãnh đạo cấp cao để gây ảnh hưởng lên cách thức tổ chức đương đầu với một thách thức kinh doanh.
- Các nhà khoa học dữ liệu tài năng không chỉ đơn giản giải quyết các vấn đề kinh doanh. Họ chọn những vấn đề cụ thể có giá trị nhất đối với tổ chức và giải quyết một lần.
- Vai trò của nhà khoa học dữ liệu vừa có phần nghệ sĩ vừa có phần phân tích.
- “Nhà khoa học dữ liệu là người ham học hỏi, có thể nhìn chằm chằm vào dữ liệu và phát hiện ra xu hướng. Nó gần giống như một cá nhân phục hưng, những người thực sự muốn tìm hiểu và mang lại thay đổi cho tổ chức.”
- Một chuyên gia phân tích dữ liệu truyền thống có thể xem xét dữ liệu từ một nguồn duy nhất như hệ thống CRM. Nhưng một nhà khoa học dữ liệu rất có thể sẽ tìm hiểu và kiểm tra dữ liệu từ nhiều nguồn không liên quan với nhau.
- Mục tiêu cuối cùng là để khám phá thông tin ẩn chứa có thể cung cấp lợi thế cạnh tranh hay giúp giải quyết một vấn đề kinh doanh.

Vậy làm sao để trở thành Nhà khoa học dữ liệu hay Chuyên gia phân tích dữ liệu

Tìm hiểu cơ bản về nghề khoa học dữ liệu

Trên trang web của mình, Microsoft đã công bố 5 video ngắn với tựa đề "Data Science for Beginners - Khoa học dữ liệu cho người mới bắt đầu".
Tại đây, người dùng sẽ tiếp cận loạt phim ngắn và những câu hỏi đáp về khái niệm cơ bản khoa học dữ liệu. Những thắc mắc thường gặp của những ai mới nhập môn ngành khoa học này được nêu chi tiết và trả lời tường tận. Kiến thức sắp xếp theo độ khó tăng dần, từ quy trình khoa học dữ liệu, các thuật toán, xây dựng mô hình, làm việc với dữ liệu, mở rộng cùng R và Python, triển khai dịch vụ web, xây dựng giải pháp...

Kỹ năng bạn phải có là:

- Bạn phải giỏi toán học thống kê cũng như máy học
- Học lập trình, viết code
- Học đến mức trở thành chuyên gia về cơ sở dữ liệu
 
Ngoài ra mình xin giới thiệu website hiện mình đang học miễn phí là https://www.dataquest.io/ 

10 lời khuyên để trở thành nhà khoa học dữ liệu

Để các bạn có một vài định hướng cho mình, xin gửi các một số lời khuyên (bên cạnh việc nâng kiến thức chuyên ngành) trong  rèn luyện để trở thành nhà khoa học kỹ thuật từ Giáo sư Jana Schaich Bor:
 
- Đặt câu hỏi, luôn tò mò và chấp nhận điều chưa biết
- Bắt đầu nghĩ về mọi thứ bạn thấy như là biến phụ thuộc và biến độc lập
- Tìm hiểu ưu điểm và nhược điểm của tính liên tục và rời rạc của một thuộc tính, đặc tính.
- Hãy luôn lắng nghe, và đóng góp ý kiến
- Luyện tập tính hoài nghi, tư duy phản biện đa chiều
- Hãy luôn tìm kiếm sự chi tiết, cụ thể
- Luôn yêu mến sự chính xác
- Phương pháp tốt nhất không nhất thiết là phổ biến nhất
- Hãy làm việc nhóm và hướng đến kết quả cuối cùng mà người yêu cầu mong muốn
- Hãy đi đôi giầy của người khác, hiểu quan điểm của người khác

Tham gia các khóa đào tạo chuyên sâu

Ông Adam Flugel - nhà tuyển dụng chuyên viên khoa học dữ liệu tại Burtch Works cho biết để trở thành một nhà khoa học dữ liệu chuyên nghiệp cần có nhiều kỹ năng từ các quá trình đào tạo. Đơn cử có thể tìm hiểu trang web DataCamp cung cấp nền tảng học tập trực tuyến từ căn bản cho đến những khóa học nâng cao có tính phí với hơn 9 triệu bài giảng, đã đào tạo hơn 500.000 nhà khoa học dữ liệu trên 150 quốc gia. DataCamp thiết lập quan hệ đối tác với những hãng công nghệ  hàng đầu như Microsoft, IBM, Kaggle, Pluralsight và RStudio cùng các học viện đào tạo uy tín như Princeton, Duke và Đại học Washington. Khoảng 70% học viên là các chuyên gia làm việc trong ngành công nghệ, tài chính và chăm sóc sức khỏe.

Kỹ năng bạn có trong trình độ này là

- Bạn phải trở thành chuyên gia về tinh gọn dữ liệu
- Hiểu tất tần tật về dữ liệu lớn và búi dữ liệu
- Thường xuyên thực hành, rút kinh nghiệm và gặp các nhà khoa học dữ liệu khác
 

Mở rộng tư duy

Để nuôi dưỡng niềm đam mê về khoa học dữ liệu, bạn hãy theo dõi và tham gia cộng đồng rộng lớn khoa học dữ liệu trên mạng. Ví dụ như trang Data Science Central, OpenDataScience.com hay KDnuggets sẽ mang đến nhiều kiến thức hữu ích, trao đổi thông tin về kỹ năng, nghề nghiệp... Những nguồn tài nguyên này chuyên cung cấp các giáo trình điện tử để người dùng nghiên cứu tùy theo trình độ.

Tìm việc phù hợp

Khoa học dữ liệu là một trong những ngành công nghệ có nhu cầu nhân lực cao vào thời điểm hiện tại và cả tương lai. Có thể dễ dàng tìm kiếm nhiều vị trí tuyển dụng trên OpenDataScience.com, Kaggle, hay Glassdoor và Indeed.com. Trong khi đó, trang One đóng vai trò như một sàn giao dịch việc làm giúp các nhà khoa học dữ liệu và doanh nghiệp đăng tải nhu cầu và tìm đối tác phù hợp.
- Hãy đi thực tập hoặc kiếm một công việc liên quan để làm

Tạo hồ sơ ấn tượng

Sau khi nhận được lời mời phỏng vấn, cần chuẩn bị bộ hồ sơ "đẹp" và những kiến thức chuyên ngành để trao đổi cùng nhà tuyển dụng. Trên trang KDnuggets có xây dựng riêng đề tài về câu hỏi phỏng vấn và phần trả lời cho quá trình xin việc nên người dùng có thể tham khảo để có thêm kinh nghiệm thực tế.
 

Nghề của thế kỉ 21

Có thể nói nghề phân tích dữ liệu lớn là nghề của thế kỷ 21 vì hiện nay thị trường rất khan hiếm nhân lực. Big Data là từ khoá được tìm kiếm nhiều nhất trên mạng xã hội LinkedIn, và tất nhiên những ai đang đi đầu trong lĩnh vực này hẳn sẽ được các headhunter (chuyên gia săn đầu người) săn đón thường xuyên. Do nhu cầu tăng vọt là vậy, nên nếu bạn là người có đầu óc phân tích và khả năng xử lý dữ liệu, việc bước chân vào ngành này sớm bao nhiêu thì cơ hội thăng tiến của bạn . Tin tốt là trong vài năm qua xuất hiện nhiều chương trình đào tạo (dưới nhiều hình thức khác nhau) đáp ứng nhu cầu chuyên gia về dữ liệu lớn. Tuy nhiên, các đơn vị đào tạo hầu hết là các trường đại học ở nước ngoài, ví dụ như các chương trình khoa học dữ liệu chuyên sâu hay phân tích nâng cao tại Viện Nghiên cứu Khoa học và Kỹ thuật Dữ liệu Columbia, Đại học Berkeley, Đại học Carnegie Mellon, Viện Công nghệ Illinois, Đại học Imperial, Đại học North Carolina, Đại học Syracuse và Đại học Tennessee…

Cảm ơn bạn đã đọc hết bài viết!

Nha thân tặng bộ source code blog này cho những ai quan tâm.

Bình luận