როგორ უნდა მიიღოთ თქვენი პირველი სამუშაო მონაცემთა მეცნიერებაში?

როგორ შეგიძლიათ მიიღოთ მისი პირველი შესვლის დონის სამუშაო, როგორც მონაცემთა მეცნიერი ან მონაცემთა ანალიტიკოსი? თუ გადახვედით მონაცემთა მეცნიერების ფორუმებს, ამ თემის გარშემო ბევრ კითხვას ნახავთ. ჩემი მონაცემების სამეცნიერო ბლოგის (data36.com) მკითხველები დროდადრო მეკითხებიან იგივე. და მე შემიძლია გითხრათ ეს სრულიად სწორი პრობლემა!

მე გადავწყვიტე ჩემი პასუხების შეჯამება ყველა ძირითადი კითხვაზე!

ახალი! მე შევქმენი ყოვლისმომცველი (უფასო) ონლაინ ვიდეო კურსი, რომელიც დაგეხმარებათ მონაცემთა მეცნიერების დაწყებაში. დააწკაპუნეთ აქ დამატებითი ინფორმაციისთვის: როგორ გავხდეთ მონაცემთა მეცნიერი.

დარეგისტრირდით აქ (უფასოდ): https://data36.com/how-to-become-a-data-sledgeist/

# 1: რა არის ყველაზე მნიშვნელოვანი მონაცემთა მეცნიერების უნარები და ინსტრუმენტები? და როგორ შეგიძლიათ მათი მიღება?

კარგი ამბავი - ცუდი ამბავი.

დავიწყებ ცუდად. 90% შემთხვევაში, ის უნარ-ჩვევები, რომლებიც თქვენ გასწავლით უნივერსიტეტებში, ნამდვილად არ არის სასარგებლო რეალურ ცხოვრებაში მონაცემთა სამეცნიერო პროექტებში. რამდენჯერმე დავწერე, რეალურ პროექტებში საჭიროა მონაცემთა კოდირების კოდირების 4 ეს უნარი:

  • bash / command line
  • პითონი
  • SQL
  • (და ზოგჯერ Java)
წყარო: KDnuggets

რომელი 2 ან 3 ყველაზე სასარგებლო დაგეხმარებათ, ეს ნამდვილად დამოკიდებულია კომპანიაში ... მაგრამ თუ თქვენ ისწავლეთ, ბევრად უფრო ადვილი იქნება სხვის სწავლა.

ასე რომ, პირველი დიდი კითხვაა: როგორ შეგიძლიათ მიიღოთ ეს ინსტრუმენტები? აქ მოდის კარგი ამბავი! ყველა ეს ინსტრუმენტი უფასოა! ეს ნიშნავს, რომ თქვენ შეგიძლიათ ჩამოტვირთოთ, დააინსტალიროთ და გამოიყენოთ ისინი მათთვის პენის გადასახადის გარეშე. შეგიძლიათ ივარჯიშოთ, ააწყოთ მონაცემთა ჰობი პროექტი ან რამე!

ახლახან დავწერე ნაბიჯ ნაბიჯ სტატია, თუ როგორ უნდა დააყენოთ ეს ინსტრუმენტები თქვენს კომპიუტერში. შეამოწმეთ აქ.

# 2: როგორ ვისწავლოთ?

არსებობს მონაცემების მეცნიერების მარტივად და ეკონომიურად სწავლის 2 ძირითადი გზა.

პირველი: წიგნები.

ქინძის ძველი სკოლა, მაგრამ მაინც სწავლის კარგი მეთოდია. წიგნებიდან შეგიძლიათ მიიღოთ ძალიან ფოკუსირებული, ძალიან დეტალური ცოდნა მონაცემთა მონაცემთა ანალიზის, სტატისტიკის, მონაცემების კოდირების და ა.შ. შესახებ. მე გამოვსახე 7 წიგნი, რომელსაც ჩემს წინა სტატიაში გირჩევთ აქ.

ტოპ 7 მონაცემთა წიგნები, რომლებიც გირჩევთ

მე -2: ონლაინ ვებინინგები და ვიდეო კურსები.

მონაცემთა მეცნიერების ონლაინ კურსები გამოდის სამართლიანი ფასებით ($ 10 - $ 500) და მოიცავს სხვადასხვა თემებს, მონაცემთა კოდირების და ბიზნესის დაზვერვის მონაცემებით. თუ თავიდანვე არ გსურთ ამაზე ფულის დახარჯვა, მე ჩამოთვლილია უფასო კურსები და სასწავლო მასალა ამ პოსტში.

(მე –3: უმცროსი მონაცემთა მეცნიერთა პირველი თვის კურსი მე შევქმენი 6 – კვირიანი ონლაინ მონაცემთა მეცნიერების კურსი, რომ მიისწრაფვიან მონაცემების მეცნიერის პრაქტიკაში და გადასაჭრელად ჭეშმარიტი ცხოვრებისეულ დავალებებზე ჭეშმარიტი ცხოვრების მონაცემებზე: უმცროსი მონაცემთა მონაცემთა მეცნიერთა პირველი თვე .)

# 3: როგორ ვივარჯიშოთ და როგორ მივიღოთ რეალური ცხოვრების გამოცდილება

ეს სახიფათოა, არა? ყველა კომპანიას სურს, რომ ჰქონდეს მინიმუმ ცოტა რეალური ცხოვრების გამოცდილების მქონე ადამიანი ... მაგრამ როგორ იღებთ რეალურ ცხოვრების გამოცდილებას, თუ გჭირდებათ პირველი ცხოვრებისეული გამოცდილება, რომ მიიღოთ თქვენი პირველი სამუშაო? კლასიკური დაჭერა -22. და პასუხი არის: საოჯახო პროექტები.

"Pet პროექტი" ნიშნავს, რომ თქვენ გაეცანით მონაცემთა პროექტის იდეას, რომელიც აღფრთოვანებას იწვევს. შემდეგ თქვენ უბრალოდ დაიწყებთ მის მშენებლობას. თქვენ შეგიძლიათ იფიქროთ მასზე, როგორც მცირე გაშვების პროცესზე, მაგრამ დარწმუნდით, რომ ყურადღების გამახვილებას აკეთებთ პროექტის შესახებ მონაცემების მეცნიერების ნაწილზე და შეგიძლიათ უბრალოდ უგულებელყოთ ბიზნესის ნაწილი. რამდენიმე იდეის შესაქმნელად, აქ არის რამდენიმე ჩემი Pet პროექტი, რომელიც ბოლო რამდენიმე წლის განმავლობაში:

  • მე შევქმენი სკრიპტი, რომელიც აკონტროლებდა უძრავი ქონების ვებსაიტს და გამომიგზავნეს რეალურ დროში საუკეთესო გარიგებები - ასე რომ, მე შემეძლო ამ გარიგებების მიღება ყველას წინაშე.
  • მე ავაშენე სკრიპტი, რომელიც ყველა სტატიას ქმნის ABC, BBC და CNN და, გამოყენებული სიტყვების საფუძველზე, დაუკავშირდა სტატიებს, რომლებიც დაახლოებით იმავე თემას ეხებოდა 3 სხვადასხვა საინფორმაციო პორტალზე.
  • პითონში მე შევქმენი თვითშეფასების ჩატიბიტი. (თუმცა ეს არც ისე ჭკვიანია - რადგან ჯერ არ ვვარჯიშობდი.)

Იყავი კრეატიული! იპოვნეთ მონაცემთა მეცნიერებასთან დაკავშირებული საოჯახო პროექტი თქვენთვის და დაიწყეთ კოდირება! თუ კედელს დაშიფვრის პრობლემა გაქვთ - ეს შეიძლება მოხდეს მარტივად, როდესაც დაიწყებთ მონაცემთა ახალი ენის შესწავლას - უბრალოდ გამოიყენეთ google და / ან stackoverflow. ჩემი ერთი მოკლე მაგალითი - იმის შესახებ, თუ რამდენად ეფექტურია stackoverflow:

მარცხენა მხარე: ჩემი შეკითხვა - მარჯვენა მხარე: პასუხი (7 წუთში)

ყურადღება მიაქციეთ ვადებს! მე გაუგზავნა ერთგვარი რთული კითხვა და პასუხი 7 წუთში დავბრუნდი. ერთადერთი, რაც მე უნდა გამეკეთებინა, იყო ასლის ჩასმა კოდი ჩემს წარმოების კოდში და ბუმი, ეს უბრალოდ მუშაობდა!

(შენიშვნა: Cross Validated არის კიდევ ერთი შესანიშნავი ფორუმი მონაცემთა მეცნიერებასთან დაკავშირებული კითხვებისთვის.)

+1 შემოთავაზება:

მაშინაც კი, თუ ეს ცოტა რთულია, შეეცადეთ მოიქცეთ მენტორი. თუ საკმარისად იღბლიანი ხართ, ნახავთ ვინმეს, რომელიც მუშაობს მონაცემთა მეცნიერთა როლში მშვენიერ კომპანიაში და რომელსაც შეუძლია ყოველკვირეულად 1 საათის განმავლობაში ან ორჯერად გატარება თქვენთან ერთად და განიხილოს ან ასწავლოს რამ.

# 4: სად და როგორ აგზავნით თქვენს პირველ სამუშაო განცხადებას?

თუ თქვენ ვერ მოახერხეთ მოძღვრის პოვნა, თქვენს პირველ კომპანიას მაინც იპოვნით. ეს იქნება თქვენი პირველი მონაცემთა მეცნიერებასთან დაკავშირებული სამუშაო, ამიტომ მე გირჩევთ არ გაამახვილოთ ყურადღება დიდ თანხებზე ან ზედმეტად ლამაზ გაშვების ატმოსფეროზე. კონცენტრირება მოახდინეთ ისეთი გარემოზე, სადაც შეგიძიათ საკუთარი თავის სწავლა და გაუმჯობესება.

მრავალეროვნულ კომპანიაში თქვენი პირველი მონაცემთა სამეცნიერო დანიშვნის მიღება შეიძლება არ შეესაბამებოდეს ამ აზრს, რადგან იქ ადამიანები ჩვეულებრივ ძალიან დაკავებულნი არიან თავიანთი ნივთებით, ამიტომ მათ არ აქვთ დრო ან / და მოტივაცია, რაც დაგეხმარებათ გაუმჯობესებაში (რა თქმა უნდა, ყოველთვის არის გამონაკლისი).

მცირე დაწყებისას, როგორც გუნდში პირველი მონაცემების შემუშავება, არც არის კარგი იდეა თქვენს შემთხვევაში, რადგან ამ კომპანიებს არ აქვთ მონაცემების უფროსი ბიჭების სწავლა.

გირჩევთ, ყურადღება გამახვილდეთ 5-500 ზომის კომპანიებზე. ეს ოქროს ნიშნავს. უფროსი მონაცემების მეცნიერები ბორტზე იმყოფებიან, მაგრამ ისინი არც თუ ისე დაკავებულები არიან თქვენს დასახმარებლად და გასწავლით.

კარგი, თქვენ იპოვნეთ რამდენიმე კარგი კომპანია ... როგორ მივმართოთ? თქვენი CV- ს რამდენიმე პრინციპი: ხაზს უსვამთ თქვენს უნარებსა და პროექტებს, და არა თქვენს გამოცდილებას (რადგან თქვენ ჯერ კიდევ არ გაქვთ მრავალი წლის განმავლობაში ქაღალდზე ჩასაწერად). ჩამოთვალეთ შესაბამისი კოდირების ენები (SQL და Python), თქვენ იყენებთ და დააკავშირეთ თქვენი დაკავშირებული სხვა github repos, ასე რომ თქვენ შეგიძლიათ აჩვენოთ, რომ თქვენ ნამდვილად გამოიყენეთ ეს ენა.

ასევე, უმეტეს შემთხვევაში, კომპანიები ითხოვენ სამოტივაციო წერილს. რა თქმა უნდა, კარგი შესაძლებლობა გამოხატოს თქვენი ენთუზიაზმი, მაგრამ შეგიძლიათ დაამატოთ რამდენიმე პრაქტიკული დეტალიც, მაგალითად, რას იქნებდით პირველ კვირებში, თუ დაქირავებული იქნებით. (მაგ. „თქვენი რეგისტრაციის ნაკადის დათვალიერებისას, ვხვდები, რომ ____ ვებგვერდი მნიშვნელოვან როლს ასრულებს. ჩემი პირველი რამდენიმე კვირის განმავლობაში მე ___, ___ და ___ (სპეციფიკურ ანალიზს) ვაკეთებ, რომ დაამტკიცოს ეს ჰიპოთეზა და უფრო ღრმად მესმის ეს. ეს შეიძლება დაეხმაროს კომპანიას გაუმჯობესების _____ და საბოლოოდ დააყენებს _____ KPI. ")

იმედია, ეს სამუშაო ინტერვიუს წარმოგიდგენთ, სადაც ცოტათი შეგიძლიათ ესაუბროთ თქვენი საყვარელი პროექტების, თქვენი სამოტივაციო წერილის შემოთავაზებების შესახებ, მაგრამ ეს ძირითადად პიროვნების შესაფერის და შემოწმებას ეხება და, ალბათ, გარკვეულ საბაზო უნარებს. თუ საკმარისად ივარჯიშეთ, ამას გაივლით… მაგრამ თუ ნერვული ტიპი ხართ და მეტი ვარჯიში გინდათ, შეგიძლიათ გააკეთოთ ეს hackerrank.com– ზე.

დასკვნა

აი, ეს ასეა. ვიცი, რომ ეს უფრო ადვილად ჟღერს, როდესაც ის დაწერილია, მაგრამ თუ ნამდვილად ხართ გადაწყვეტილი, რომ ხართ მონაცემთა მეცნიერი, არ იქნება პრობლემა, რომ ეს მოხდეს! Წარმატებებს გისურვებთ ამაში!

თუ გსურთ სცადოთ, რა არის უმცროსი მონაცემების მეცნიერი ყოფნის დაწყების ნამდვილი ცხოვრების დაწყების შესახებ, შეამოწმეთ ჩემი 6-კვირიანი ონლაინ მონაცემთა მეცნიერების კურსი: უმცროსი მონაცემთა მეცნიერთა პირველი თვე!

და თუ გსურთ მეტი ინფორმაცია შეიტყოთ მონაცემთა მეცნიერების შესახებ, შეამოწმეთ ჩემი ბლოგი (data36.com) და / ან გამოიწეროთ ჩემი ბიულეტენი! და არ გამოტოვოთ ჩემი ახალი კოდირების სამეურვეო სერია: SQL მონაცემთა ანალიზისთვის!

Მადლობა წაკითხვისთვის!

ისიამოვნეთ სტატიით? გთხოვთ, ნება მიბოძეთ გთხოვთ, დააჭირეთ ქვემოთ მოცემულ ეს ასევე ეხმარება სხვა ადამიანებს ნახონ სიუჟეტი!

ტომი მესტერი data36.com– ის ავტორი Twitter: @ data36_com