2021 беше изключително динамична и успешна година за екипа на Fourth – година, в която компанията взе стратегическо решение да създаде своя Data Science отдел в технологичния си хъб в София. За да разберем как само за 6 месеца компанията изгради ново звено от професионалисти, които вече постигат резултати и доставят работещи Data Science решения в екосистема на стотици хиляди клиенти, говорихме с Милен Чечев, Head of Data Science във Fourth. Ето какво ни разказа той.
За много кратко време Data Science (DS) екипът във Fourth изгради нова инфраструктура за внедряване на решения, базирани на големи данни (Big Data). Как го постигнахте?
Постигнахме го със страхотен екип, разбира се 🙂 Започнахме изграждането на отдела през месец май тази година, като към момента в отдела сме вече 9 човека, работещи в направление Data Science.
Основната мисия на Fourth е да създава инструменти, с които да подпомага и дигитализира “hospitality” индустрията – глобални вериги хотели, ресторанти, заведения за бързо хранене. А целта на нашия отдел е да добави “intelligence” към съществуващото портфолио от инструменти. През годините компанията е имала различни подходи към прогнозирането, a с изграждането на Data Science отдел успяхме вече да създадем и централизирана стратегия за развитието на прогнозиране, базирано на machine learning.
Първият етап от работата на екипа включваше избор и изграждане на нова инфраструктура и взимане на доста архитектурни решения. Лично моят опит до момента включваше работа с Google Cloud и AWS, а във Fourth имам възможността да се запозная и с Azure Machine Learning Service. Това е и платформата, която избрахме за развитието на нашата MLOps инфраструктура.
Направихме този избор, тъй като при анализа на различните функционалности се оказа, че за някои DS проблеми, за които в другите платформи трябва да се имплементират специфични процеси (например запазване на версии на модели и данни), в Azure има директни интегрирани решения. По мое мнение тази облачна инфраструктура към момента е по-добре развита от останалите, но разбира се трябва да имаме предвид, че в нашия сектор постоянно се правят промени и се внедряват иновации, така че надпреварата за лидерската позиция е много динамична.
Какви видове прогнозиране правите за вашите клиенти? Как се справяте с “непредвидимите” събития и форсмажорни обстоятелства, пред които са изправени напоследък бизнесите в сектора?
Първата задача, с която се заехме, е да подобрим прогнозирането на продажбите на нашите клиенти, които оперират в стотици хиляди обекти и на различни локации по целия свят. Правим предвиждания за продажби за конкретен ден, час, дори за определени 15 минути от деня. Освен обем на продажбите, правим прогнози и за продажби на конкретни типове продукти и техните различия. По този начин ресторантите и хотелите разполагат с добра видимост за бъдещето и могат да вземат информирани и стратегически решения спрямо търсенето за определен период.
Работата е много предизвикателна и интересна благодарение на огромно количество данни, натрупани в системите на Fourth за повече от 20 години.
За да може един Machine Learning модел да е възможно най-добър, са необходими и много данни, които не включват само статистика за продажби от минали периоди, а и информация за факторите, от които те биха се повлияли. Например, ако в конкретен ден до определен обект на наш клиент ще има голямо спортно събитие, от което се очаква продажбите да се увеличат, ние ще го засечем и ще “предупредим” клиентите си да планират по-добре тези извънредни обстоятелства. Те ще трябва да осигурят повече продукти заради повишеното търсене и да оптимизират смените на персонала си, за да се справят с натоварването.
Тези допълнителни данни, които събираме и обработваме, са изключително важни. През последните две години именно индустрията, в която оперират нашите клиенти, беше изправена пред огромни предизвикателства, породени от неизвестното. И в момента е безценно умението да се борави добре с данните и да се правят прогнози, на база на които бизнесите да могат да се подготвят и адаптират. Точно тук се опитваме да помогнем и ние.
Какво самият Вие не знаехте за индустрията и открихте чрез работата си с данните на ресторантите?
Данните, с които работим, имат доста интересни характеристики – сезонности на различни нива (седмица, месец, година), разнообразни тенденции и поведение при събития.
В екипа работим по всеки проблем, разглеждаме го от всички страни. Изпробваме различни хипотези, експериментираме, стараем се да сме както устойчиви, така и гъвкави.
Какъв е технологичният stack, който използвате? Какво трябва да знаят специалистите по големи дани, които искат да работят във Fourth?
Използваме основно технологичния стак на Python за Machine Learning, като развиваме MLOps инфраструктура в Azure. Специалистите, които работят във Fourth, имат отлични теоретични и практични знания в работа с големи данни, разработването както на класически ML алгоритми, така и на Deep Learning алгоритми. Определено е предимство, ако кандидатите са запознати и с новостите в ML света като NLP, Transformers и Reinforcement Learning.
След първите 6 месеца – какво ви предстои оттук нататък?
Във Fourth обичаме да казваме – the sky is the limit. Целта ни е да разработим най-доброто прогнозиране за ресторантьорския и хотелиерския бизнес в света. Имаме растящ списък от бъдещи Data Science проекти. Планираме да разширим дейността си и да продължим да подобряваме продуктите на компанията. Горд съм да споделя, че вече имаме и стажанти в отдела, които допринасят към работата на екипа чрез изследвания на рискови и експериментални ML проекти.
Очаквам 2022 година да е много силна и екипът ни да се разрасне, като отворим нови позиции.
Вярвам, че най-интересното тепърва предстои 🙂
А ако и ти си специалист по работата с големи данни, имаш както необходимите познания, така и иновативно мислене – разгледай какво предлагат Fourth на обичайното място: Job Board-a на DEV.BG.