AI Summer camp
💥💥💥 A teraz specjalna informacja dla studentów!
Zapraszamy serdecznie na 3 miesięczny AI Summer Camp w Voicelab.ai, gdzie będziecie mogli uzyskać nowe umiejętności z zakresu AI, ML czy NLP, pracować ze specjalistami w swojej dziedzinie, być uczestnikami ważnych projektów i uzyskać certyfikaty potwierdzające Wasze umiejętności!
Gotowi na wakacyjną przygodę ze sztuczną inteligencją?
⏰ Kiedy: lipiec – wrzesień 2022
➡ Tryb: stacjonarny w Gdańsku lub online – wymiar godzin – 40h/tydz.
🙋♂️ Ilość miejsc: 10
💡 Wymagania i jak się zgłosić?
Jesteś studentem?
Posiadasz podstawową znajomość zagadnień machine learning i Pythona?
Jesteś zainteresowanie tematyką machine learning?
Wyślij swoje CV wraz z linkami, portfolio / projektami, którymi chcesz się pochwalić korzystając z formularza.
🚀 Jakie umiejętności zdobędziesz?
- Pogłębienie wiedzy z uczenia maszynowego i NLP.
- Codzienne wsparcie doświadczonych mentorów.
- Praca naukowo-badawcza nad najnowszymi metodami AI.
- Dostęp do jednych z najlepszych serwerów na rynku.
- Możliwość zatrudnienia po odbyciu stażu.
- Nauka pracy w PyTorch, PyTorch Lightning, transformers (HuggingFace) oraz obsługi narzędzi do MLOps i innych.
Program działań:
Tydzień 1: Mini szkolenia, przedstawienie zasad pracy, wprowadzenie do tematyki NLP/Audio. Codziennie rano inne jedno godzinne szkolenie z mini-zadaniami. Integracja – pizza day w biurze ze współpracownikami.
Tydzień 2: Rozpoczęcie pracy nad projektem. Przegląd literatury, czytanie artykułów, szukanie danych oraz przykładowych zbiorów. Na koniec tygodnia prezentacja 10-15 minut każdego projektu, który aktualnie jest w danej dziedzinie na topie.
Tydzień 3-5: Prace programistyczne. Korzystanie z otwartych danych i kodów. Co tydzień seminarium z przedstawieniem postępów prac, problemów oraz rozwiązań.
Tydzień 6-7: Połowa czasu trwania projektu. Próba przeniesienia rozwiązania na język polski. Przygotowanie wpisu na bloga nr 1.
Tydzień 8-9: Wykorzystanie rezultatów w praktyce. Przykładowo, powiększenie zbioru z intencji korzystając z parafrazowania. Trening modelu intencji (korzystając z gotowego kodu). Porównanie wyników.
Tydzień 10-11: Analiza wyników. Jeśli są dobre to rozpoczęcie pisania publikacji na małą konferencję. Przygotowanie wpisu na bloga nr 2.
Tydzień 12: Kończenie projektu. Refactor kodu, poprawki w dokumentacji, podsumowanie osiągnięć. Przygotowanie wpisu na bloga podsumowującego wszystkie projekty. Ceremonia zakończenia camp’u (wręczenie certyfikatów). Wspólna integracja.
Przykładowe tematy:
Emotion recognition with AI.
Emotional TTS.
Conditional generation of emotional text.
Text style transfer.
Neural Paraphrasing.
Text or meeting summarization.
Few-shot learning in NLP.
Few-shot learning in TTS.
Argument and objection detection.
🙋♂️🙋♂️🙋♂️Mentorzy:
🙋♀️ Agnieszka Mikołajczyk – Autorka zbiorów danych, prac naukowych i publikacji, laureatka licznych stypendiów i nagród. Na co dzień prowadzi badania w ramach grantu Preludium „Detecting and overcoming bias in data with explainable artificial intelligence”, przyznanego przez Polskie Narodowe Centrum Nauki (biasinml.netlify.app). Pracuje nad różnymi zagadnieniami R&D w zespole NLP w Voicelab.ai. Zajmowała się odtwarzaniem interpunkcji, modelowaniem tematów, generacją tekstu, parafrazowaniem, predykcją intencji oraz sentymentu. Jest współorganizatorką zadań PolEval2021 i PolEval 2022 dotyczących przewidywania i odtwarzania znaków interpunkcyjnych. W wolnym czasie organizuje i aktywnie udziela się w środowisku naukowym: wspólnie z zespołem zorganizowała, a następnie kierowała badaniami w projekcie HearAI, którego celem było wsparcie środowiska Głuchych poprzez modelowanie języka migowego z wykorzystaniem głębokiego uczenia maszynowego (hearai.pl). Była organizatorka i liderka zespołu w projekcie open-source detectwaste.ml.
🙋♂️ Piotr Pezik – Dr hab. Piotr Pęzik jest profesorem UŁ w Instytucie Anglistyki, autorem prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Obszarem jego zainteresowań językoznawczych jest frazeologia dystrybucyjna w ujęciu korpusowym. Był wykonawcą i kierownik krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych. Członek konsorcjum Narodowego Korpusu Języka Polskiego, Polskiego Towarzystwa Językoznawczego oraz stowarzyszenia META-TRUST. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Advertine) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarki frazeo.pl, monitorcorpus.com, słowników frazeologicznych HASK EN i HASK PL, Spokes. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun specjalnego urządzenia badawczego — Wyszukiwarki PELCRA dla NKJP.
🙋 Szymon Marszałkowski – Ukończył Inżynierię Dźwięku i Obrazu na wydziale ETI Politechniki Gdańskiej. Brał udział w grantach badawczych dotyczących wykorzystania ML w computer vision oraz systemach pomiarowych jakości powietrza. W VoiceLab zajmuje się modelowaniem akustycznym opartym na DNN w systemach rozpoznawania mowy.
Zainteresowany ofertą?