Welkom bij JoinSeven, Gaetana!
Op 1 september startte Gaetana Ruggiero als Data Scientist bij JoinSeven. Voor ons betekende het de eerste medewerker bij ons in dienst. We besloten Gaetana te onderwerpen aan een heus interview. Wie Gaetana is, wat haar drijft en wat ze gaat doen, lees je in dit blog.
Vraag 1
Wie ben je?
Ik ben Gaetana Ruggiero, 28 jaar oud, woon in Amsterdam en ben opgegroeid in een klein dorp in de buurt van Napels, Italië. Ik ben een Data Scientist en Machine Learning Engineer met een passie voor taal. Na mijn bacheloropleiding formele taalkunde aan de Universiteit van Napels volgde ik een dubbele masteropleiding in Malta en Nederland op het vlak van data science en natural language processing (NLP).
Na mijn studies heb ik een tijdje gewerkt als onderzoeksassistent op de Universiteit van Turijn, maar ik wilde erg graag weer terug naar Amsterdam om hier te wonen en werken!
In mijn vrije tijd ben ik gepassioneerd bachata-danser. Naast dat ik het zelf graag doe, geef ik in mijn oude studentenstad Groningen elke woensdagavond les. En naast Italiaans spreek ik ook Engels, Spaans en Nederlands.
“Dit wil ik meemaken!”
Vraag 2
Waarom koos je voor JoinSeven?
In mijn zoektocht naar een baan als Data Scientist kwam ik er al snel achter dat het een ontzettend breed vakgebied is. En dat het niet vanzelfsprekend is dat je als Data Scientist met tekst- en taalverwerking (NLP) aan de slag gaat. Het is een niche binnen het vakgebied. JoinSeven richt zich juist specifiek hierop en dat spreekt mij qua rol erg aan!
Daarnaast zocht ik een dynamische rol bij een jonge startup. In de eerste gesprekken bleek al dat hier ontzettend veel ideeën liggen en ook ruimte om daar iets mee te doen. Na onze kennismaking dacht ik gelijk “dit wil ik meemaken”!
Tot slot gaat JoinSeven verder dan het onderzoekende en experimenterende aspect wat ik gewend ben vanuit de universiteit. JoinSeven maakt producten met echte eindgebruikers. Dat betekent ook dat ik als Data Scientist verder moet kijken dan enkel de data, het model, de code en de uitkomst ervan: de vertaling naar het eindproduct, de marketing en de dienstverlening naar gebruikers. Mensen echt blij zien worden van het product en het in de dagelijkse praktijk zien gebruiken. Daar krijg ik veel energie van.
Vraag 3
Wat ga je bij JoinSeven doen?
Mijn primaire werkzaamheden zijn tweeledig: allereerst ga ik aan de slag als Data Scientist en Machine Learning Engineer binnen lopende projecten. Er starten binnenkort verschillende pilots en trajecten met Codi. Daarnaast draai ik mee in het nieuwe Startup in Residence programma, waarbij we “Innovatieve vraagstukken” uit formele beleidsteksten proberen te destilleren. En als derde project gaan we binnenkort bij een adviesbureau uit het grote MKB aan de slag om commerciële waarde uit openbare tekstdata te halen. Super afwisselend en interessant!
Als tweede (en soms in combinatie met mijn rol in projecten) ontwikkel ik allerlei modellen en experimenten op het Dataplatform Heptagon. Voorbeelden zijn de detectie van vergelijkbare documenten, automatische samenvattingen van teksten, vraag-en-antwoord modellen en nog meer.
En daarnaast ook vooral inwerken! Björn, Bart en Niels zijn met veel dingen bezig. Daar wil ik alles van weten! Ik voelde me hier vanaf dag één trouwens welkom: Ze hadden taart geregeld, bloemen en op het whiteboard op kantoor stond ontzettend groot “WELKOM GAETANA!”, daar werd ik wel heel blij van.
Vraag 4
Wat is NLP?
NLP staat voor Natural Language Processing. Het is een deelgebied van computerwetenschap dat zich tussen taalkunde, informatica en kunstmatige intelligentie bevindt. Bij NLP houd je je bezig met de interacties tussen computers en menselijke taal. Het bevat allerlei technieken die ontworpen zijn om menselijke taal (bijvoorbeeld tekst of spraak) te begrijpen en te analyseren. Door deze technieken zijn allerlei nieuwe innovaties mogelijk!
Ik zit nog midden in mijn verkenning op de toepassing op de data in ons dataplatform, maar denk bijvoorbeeld aan het volgende:
- Het automatisch categoriseren of classificeren van tekst
- Het achterhalen van emoties of ‘sentiment’ in tekst
- Het automatisch genereren van samenvattingen van tekstdocumenten
- Het vergelijken van teksten, bijvoorbeeld ten behoeve van het beantwoorden van vragen
- Het automatisch genereren van tekst
- En zo kan ik nog wel even doorgaan. Er is zoveel mogelijk en ik kan niet wachten om ermee aan de slag te gaan!
Vraag 5
Wil je daar af en toe
iets over schrijven?
Ja, dat is leuk! Ik schrijf er binnenkort graag een uitgebreidere blog(reeks) over!