Dotazy na rozhovor s Google Data Science: Vše, co potřebujete vědět, abyste to mohli rozluštit



Tento článek vám poskytne spoustu dotazovacích dotazů Google Data Science Interview Questiosn, procesu pohovoru a předpokladů pro podání žádosti o práci ve společnosti Google.

Získání zaměstnání v globálně renomované společnosti, jako je Google, je pro mnoho lidí vysněná práce. Mají jedny z nejtalentovanějších vědců pro výzkum AI, a ve světě. Zdrojů pro Google není mnoho Dotazujte se online a není snadné se tam zamestnat. V tomto článku se tedy budu zabývat následujícími tématy:

Popis práce a požadavky

S průměrným platem 169 067 USD , včetně bonusu. Mzda vědce v Google se pohybuje od 120 000–280 000 $ . S tímto vysokým platem potřebujete znát správné požadavky na práci, kterou žádáte. Ačkoli se požadavky liší od polohy k poloze, níže uvádíme některé z běžných:

Minimální požadavek:





jak nastavit classpath v systému Windows 10

google

  • Magisterský titul v kvantitativní disciplíně (statistika, operační výzkum, informatika)
  • 2 roky praxe v oblasti analýzy dat
  • Zkušenosti se statistickým softwarem (např. R , , MATLAB, Pandy) a
  • Zkušenosti s databázovými jazyky (např. SQL )

Odpovědnosti:



  • Pracujte s velkými a složitými datovými sadami. Vyřešte obtížné problémy s neobvyklou analýzou a podle potřeby použijte pokročilé analytické metody
  • Provádějte analýzu, která zahrnuje sběr dat a specifikaci požadavků, zpracování, analýzu, průběžné výsledky a prezentace
  • Vytvářejte a prototypujte kanály analýzy iterativně, abyste poskytli přehledy v měřítku
  • Rozvíjejte komplexní znalosti o datových strukturách a metrikách Google a zasazujte se o změny tam, kde je to nutné pro vývoj produktu
  • Interakce napříč funkcemi, vytváření obchodních doporučení (např. Poměr nákladů a přínosů, předpovídání, analýza experimentů)
  • Výzkum a vývoj analytických, předpovídacích a optimalizačních metod ke zlepšení kvality produktů společnosti Google zaměřených na uživatele

Proces rozhovoru se společností Google Data Science

Vymazání užšího výběru je samo o sobě těžký úkol, který zcela závisí na vašem Životopis, motivační dopis a Zkušenosti . Google Data Science Interview Questions are a combination of Brain teasers and Technical Queries. Prvním procesem je obvykle telefonický rozhovor.

Telefonický rozhovor:

Skládá se z otázek většinou založených na (konkrétní a teoretické) a silně založené na . Otázky se také liší podle projektů, na kterých jste pracovali.
  • Případ 1: Rozhovory se týkaly technik extrakce funkcí, PCA (používá se v projektech), korelační analýzy a některých klasifikačních technik, které byly použity (SVM, GBM, neurální síť). Proč ne logistická regrese, proč GBM? - V zásadě otázky, které se točí kolem oddělitelnosti tříd.
  • Případ 2: Proč používat výběr funkcí? Pokud jsou dva prediktory vysoce korelované, jaký je účinek na koeficienty v logistické regrese? Jaké jsou intervaly spolehlivosti koeficientů?
  • Případ 3: Disk se točí na vřetenu a vy nevíte, jakým směrem se disk otáčí. Dostanete sadu čepů. Jak pomocí kolíků popíšete, jakým způsobem se disk otáčí?
Po telefonických rozhovorech jsou to tváří v tvář a kódovací kola. Pojďme tedy diskutovat o nejběžnějších dotazech na rozhovor s Google Data Science. Ačkoli tyto otázky nemusí být kladeny přesně, jak je uvedeno níže, pokusil jsem se jich pokrýt hodně.

Dotazy na rozhovor s Google Data Science

Tyto otázky nejsou záhadné, protože Google místo toho tyto otázky přestal klást, mají podobné otázky, které nazývají Otázky k řešení problémů . Je kladeno mnoho otázek o strojovém učení, od obecných po praktické. Google v zásadě spíše zahrnuje hloubku témat než hloubku. Q1. Jste v kasinu a můžete si hrát se dvěma kostkami. Vyhrajete 10 $ pokaždé, když hodíte 5. Pokud hrajete, dokud nevyhrajete a pak se nezastavíte, jaká je očekávaná výplata? Q2. Chystáte se nastoupit do letadla do Londýna, chcete vědět, zda si musíte přinést deštník nebo ne. Zavoláte tři ze svých náhodných přátel a jako každý z nich, pokud prší. Pravděpodobnost, že váš přítel říká pravdu, je 2/3 a pravděpodobnost, že na vás hrají žert lhaním, je 1/3. Pokud všichni 3 z nich řeknou, že prší, tak jaká je pravděpodobnost, že ve skutečnosti prší v Londýně. Q3. Jak by přidat nové Facebook členy do databáze členů a kódovat jejich vztahy k ostatním v databázi? Q4. Jak otestujete, že existuje větší pravděpodobnost, že uživatel zůstane aktivní po 6 měsících, protože má nyní více přátel? Q5. Dostanete 40 karet se čtyřmi různými barvami - 10 zelených karet, 10 červených karet, 10 modrých karet a 10 žlutých karet. Karty každé barvy jsou očíslovány od jedné do deseti. Náhodně jsou vybrány dvě karty. Zjistěte pravděpodobnost, že vybrané karty nemají stejné číslo a stejnou barvu. Q6. Vytvořte program v jazyce, který si vyberete, abyste mohli číst textový soubor s různými tweety. Výstupem by měly být 2 textové soubory - jeden obsahující seznam všech jedinečných slov mezi všemi tweety spolu s počtem opakovaných slov a druhý soubor by měl obsahovat střední počet jedinečných slov pro všechny tweety. Q7. Co uděláte, pokud odstranění chybějících hodnot z datové sady způsobí zkreslení? Q8. Disk se točí na vřetenu a vy nevíte, jakým směrem se disk otáčí. Dostanete sadu čepů. Jak pomocí kolíků popíšete, jakým způsobem se disk otáčí? Q9. Jak navrhnete modul doporučení pro pracovní místa? Q10. Jaký druh produktu chcete ve společnosti Google postavit? Q11. Automobily jsou vybaveny systémem pro sledování rychlosti, aby pojišťovny mohly sledovat stav našeho řízení. Na základě tohoto nového schématu, na jaké obchodní otázky lze odpovědět? Q12. Jak se můžete rozhodnout, zda je jeden algoritmus lepší než druhý? Q13. Krabice má 12 červených karet a 12 černých karet. Další pole má 24 červených karet a 24 černých karet. Chcete náhodně dobrat dvě karty z jednoho ze dvou polí, u kterého pole je vyšší pravděpodobnost získání karet stejné barvy a proč? Q14. Jaký je rozdíl mezi pytlovaným modelem a vylepšeným modelem? Q15. Vytváříte přehled pro nahrávání obsahu uživatele každý měsíc a sledujete náhlý nárůst počtu nahrávání za měsíc leden. Nárůst počtu nahrávek je, zejména při nahrávání obrázků. Co si myslíte, že to bude příčinou a jak otestujete tuto náhlou špičku? Q16. Vlastníte oděvní podnik a chcete si vylepšit své místo na trhu. Jak to uděláte ze země? Q17. Jak se rozhodnete, které verze dvou algoritmů přepočtových cen fungují lépe pro jakoukoli leteckou společnost? Q18. Jaká je míra volnosti pro laso? Q19. Jaký je rozdíl mezi iterátorem, generátorem a porozuměním seznamu v Pythonu? Q20. Jak na základě sady webových stránek a změn na webu otestujete novou funkci webu, abyste zjistili, zda změna funguje pozitivně? Q21. Vzhledem k matici dimenzí MxN s každou buňkou obsahující abecedu, najděte, zda je v ní obsažen řetězec nebo ne. Q22. Jak vytvoříte systém ukládání do mezipaměti pomocí pokročilé datové struktury, jako je hashmap? Q23. Pokud byste mohli získat datovou sadu o jakémkoli tématu, které vás zajímá, bez ohledu na metody sběru nebo zdroje, jak by ta datová sada vypadala a co s ní uděláte? Q24. Co jsou metody detekce anomálií? Q25. Jak funguje ukládání do mezipaměti a jak jej používáte v datové vědě? Takže, tímhle končíme tento článek. Dotazy na Google Data Science Interview jsou většinou podle scénáře a požadovat, abys měl Schopnosti řešení problémů a navíc musíte vědět, jak aplikovat Data Science na tyto situace. Doufám, že vám to dá perspektivu, abyste byli připraveni na jakýkoli rozhovor o datových vědách v budoucnu. Ať už je to Google, Microsoft, Apple nebo Uber. Všichni technologičtí obři kladou podobné typy otázek, pokud jde o datovou vědu, protože jde o rozsáhlé a zároveň nové pole. vám umožní ovládat nástroje a systémy používané profesionály v oboru datových věd. Zahrnuje školení v oblasti statistik, datové vědy, Pythonu, Apache Spark & ​​Scala, Tensorflow a Tableau. Učební plán byl určen rozsáhlým výzkumem více než 5 000 popisů pracovních míst po celém světě. Pokud máte nějaké dotazy, neváhejte je zmínit v sekci komentářů níže.