This site use Cookies. Read privacy policy
OK
OK
API
Blog
Research
Careers
AI Summer camp
Contact
Request a Quote

Conversational Intelligence

Analyze conversations in your company and sell more, understand users, increase UX

Cognitive Automation

Lower your customer care cost by automating repetitive processes

other products

Wordlify
Subtitles
Dictate
Media Monitoring

AI Summer camp

💥💥💥 A teraz specjalna informacja dla studentów!

Zapraszamy serdecznie na 3 miesięczny AI Summer Camp w Voicelab.ai, gdzie będziecie mogli uzyskać nowe umiejętności z zakresu AI, ML czy NLP, pracować ze specjalistami w swojej dziedzinie, być uczestnikami ważnych projektów i uzyskać certyfikaty potwierdzające Wasze umiejętności!

Gotowi na wakacyjną przygodę ze sztuczną inteligencją?

Kiedy: lipiec – wrzesień 2022

Tryb: stacjonarny w Gdańsku lub online – wymiar godzin – 40h/tydz.

🙋‍♂️ Ilość miejsc: 10

💡 Wymagania i jak się zgłosić?

Jesteś studentem?

Posiadasz podstawową znajomość zagadnień machine learning i Pythona?

Jesteś zainteresowanie tematyką machine learning?

Wyślij swoje CV wraz z linkami, portfolio / projektami, którymi chcesz się pochwalić korzystając z formularza.

🚀 Jakie umiejętności zdobędziesz?

  1. Pogłębienie wiedzy z uczenia maszynowego i NLP.
  2. Codzienne wsparcie doświadczonych mentorów.
  3. Praca naukowo-badawcza nad najnowszymi metodami AI.
  4. Dostęp do jednych z najlepszych serwerów na rynku.
  5. Możliwość zatrudnienia po odbyciu stażu.
  6. Nauka pracy w PyTorch, PyTorch Lightning, transformers (HuggingFace) oraz obsługi narzędzi do MLOps i innych.

Program działań:

Tydzień 1: Mini szkolenia, przedstawienie zasad pracy, wprowadzenie do tematyki NLP/Audio. Codziennie rano inne jedno godzinne szkolenie z mini-zadaniami. Integracja – pizza day w biurze ze współpracownikami.

Tydzień 2: Rozpoczęcie pracy nad projektem. Przegląd literatury, czytanie artykułów, szukanie danych oraz przykładowych zbiorów. Na koniec tygodnia prezentacja 10-15 minut każdego projektu, który aktualnie jest w danej dziedzinie na topie.

Tydzień 3-5: Prace programistyczne. Korzystanie z otwartych danych i kodów. Co tydzień seminarium z przedstawieniem postępów prac, problemów oraz rozwiązań.

Tydzień 6-7: Połowa czasu trwania projektu. Próba przeniesienia rozwiązania na język polski. Przygotowanie wpisu na bloga nr 1.

Tydzień 8-9: Wykorzystanie rezultatów w praktyce. Przykładowo, powiększenie zbioru z intencji korzystając z parafrazowania. Trening modelu intencji (korzystając z gotowego kodu). Porównanie wyników.

Tydzień 10-11: Analiza wyników. Jeśli są dobre to rozpoczęcie pisania publikacji na małą konferencję. Przygotowanie wpisu na bloga nr 2.

Tydzień 12: Kończenie projektu. Refactor kodu, poprawki w dokumentacji, podsumowanie osiągnięć. Przygotowanie wpisu na bloga podsumowującego wszystkie projekty. Ceremonia zakończenia camp’u (wręczenie certyfikatów). Wspólna integracja.

Przykładowe tematy:

Emotion recognition with AI.

Emotional TTS.

Conditional generation of emotional text.

Text style transfer.

Neural Paraphrasing.

Text or meeting summarization.

Few-shot learning in NLP.

Few-shot learning in TTS.

Argument and objection detection.

🙋‍♂️🙋‍♂️🙋‍♂️Mentorzy:

🙋‍♀️ Agnieszka Mikołajczyk – Autorka zbiorów danych, prac naukowych i publikacji, laureatka licznych stypendiów i nagród. Na co dzień prowadzi badania w ramach grantu Preludium „Detecting and overcoming bias in data with explainable artificial intelligence”, przyznanego przez Polskie Narodowe Centrum Nauki (biasinml.netlify.app). Pracuje nad różnymi zagadnieniami R&D w zespole NLP w Voicelab.ai. Zajmowała się odtwarzaniem interpunkcji, modelowaniem tematów, generacją tekstu, parafrazowaniem, predykcją intencji oraz sentymentu. Jest współorganizatorką zadań PolEval2021 i PolEval 2022 dotyczących przewidywania i odtwarzania znaków interpunkcyjnych. W wolnym czasie organizuje i aktywnie udziela się w środowisku naukowym: wspólnie z zespołem zorganizowała, a następnie kierowała badaniami w projekcie HearAI, którego celem było wsparcie środowiska Głuchych poprzez modelowanie języka migowego z wykorzystaniem głębokiego uczenia maszynowego (hearai.pl). Była organizatorka i liderka zespołu w projekcie open-source detectwaste.ml.

🙋‍♂️ Piotr Pezik – Dr hab. Piotr Pęzik jest profesorem UŁ w Instytucie Anglistyki, autorem prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Obszarem jego zainteresowań językoznawczych jest frazeologia dystrybucyjna w ujęciu korpusowym. Był wykonawcą i kierownik krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych. Członek konsorcjum Narodowego Korpusu Języka Polskiego, Polskiego Towarzystwa Językoznawczego oraz stowarzyszenia META-TRUST. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Advertine) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarki frazeo.pl, monitorcorpus.com, słowników frazeologicznych HASK EN i HASK PL, Spokes. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun specjalnego urządzenia badawczego — Wyszukiwarki PELCRA dla NKJP.

🙋 Szymon Marszałkowski – Ukończył Inżynierię Dźwięku i Obrazu na wydziale ETI Politechniki Gdańskiej. Brał udział w grantach badawczych dotyczących wykorzystania ML w computer vision oraz systemach pomiarowych jakości powietrza. W VoiceLab zajmuje się modelowaniem akustycznym opartym na DNN w systemach rozpoznawania mowy.

Apply for this Job
Resume / CV

Zainteresowany ofertą?