«Прослушка», магия алгоритмов и этика: как в Казахстане защищают персональные данные
Как алгоритмы формируют сервисы, а компании несут ответственность за работу с данными, в интервью с дата-инженером
В Казахстане приняли Цифровой кодекс, теперь работа с персональными данными строго регулируется. Их хранение, согласие пользователей и прозрачность алгоритмов стали обязательными. За этими юридическими рамками скрывается суть современных технологий: алгоритмы предсказывают наши действия, предлагают, что может заинтересовать нас завтра, и помогают бизнесу принимать решения. Данные пользователей стали «золотой жилой» для современного бизнеса, но где та тонкая грань между эффективными решениями и этикой? В беседе с Azattyq Rýhy дата-инженер Толғанай Мұрат рассказала, как аналитика превращает наши действия в прогнозы, почему в ленте приложений мы натыкаемся на то, о чем думали/говорили ранее, и почему последнее слово при принятии решений всегда остается за человеком.
Фото из личного архива
— Кто такой дата-аналитик (data в переводе с англ. «данные» — AR) и почему ваши услуги важны не только бизнесу, но и для пользователей?
— Дата-аналитик – это специалист, который превращает сырые данные в понятные выводы и решения. Я собираю данные, очищаю их, анализирую и помогаю понять, что на самом деле происходит и что делать дальше. Для бизнеса это важно, потому что решения принимаются на фактах: где теряются деньги, какие продукты работают, где находятся узкие места для пользователей. Польза для клиентов тоже прямая. Аналитики помогают делать сервисы удобнее, быстрее и честнее, улучшать рекомендации, снижать количество ошибок и персонализировать опыт. По сути, я соединяю данные с реальной жизнью, чтобы и компания, и клиент получали лучший результат.
— Какие эффективные инициативы в бизнесе стали возможны благодаря аналитике данных?
— Например, в одной компании мы отменили развитие перспективной фичи (с англ. feature – отдельная функция продукта — AR), потому что данные показали, что ею пользовались меньше 3% клиентов. Вместо этого мы усилили другой сценарий, который давал рост конверсии. В другом случае аналитика воронки выявила узкое место в онбординге (с англ. onboarding – первый опыт пользователя с продуктом — AR). После правок ретеншн (с англ. retention – удержание пользователей — AR) вырос примерно на 10-15%. Также были решения по ценообразованию. A/B-тесты (метод проверки гипотез в сервисе — AR) показали, что небольшие изменения в тарифах увеличивают выручку без потери пользователей. Такие решения редко принимаются интуитивно, именно данные позволяют принимать уверенные, измеримые решения.
— Бывали ли случаи, когда данные вводили в заблуждение, а правильное решение приняли интуицией?
— Такое бывает, особенно когда данные неполные или потерян контекст. Однажды метрики показывали падение вовлеченности, и по цифрам логично было упростить продукт. Но команда чувствовала, что проблема во внешнем факторе. В итоге оказалось, что параллельно изменился источник трафика, и аудитория стала другой. Мы не стали сокращать функциональность, а переработали онбординг под новую аудиторию, и показатели восстановились. Это хороший пример того, что данные важны, но без понимания бизнеса и здравого смысла они могут привести к неправильным выводам. Лучшее решение – всегда комбинировать аналитику и человеческий опыт.
— Какие вещи о пользователях можно узнать только через аналитику? И где проходит тонкая грань между аналитикой и личными границами?
— Через пользовательские шаги можно увидеть, какие действия вызывают фрустрацию, какие фичи декларируются, но не используются, и какие паттерны поведения повторяются. Так можно понять реальную мотивацию не по ответам пользователей, а по их действиям: что они выбирают, сколько времени тратят, где сомневаются и где останавливаются. Тонкая грань между аналитикой и этикой проходит там, где начинается скрытое влияние или избыточный сбор данных. Когда мы не просто улучшаем продукт, а начинаем манипулировать поведением или собирать больше информации, чем нужно для создания ценности для пользователя. Хорошая аналитика отвечает на вопрос «Как сделать сервис лучше для человека?» Плохая – «Как выжать из него максимум?» Поэтому для меня принцип простой: минимальные данные, прозрачные цели и фокус на пользу для пользователя, а не только для бизнеса.
— Как понять, что продукт действительно удобен и востребован, а не кажется таковым разработчикам?
— Если продуктом регулярно пользуются без дополнительного подталкивания и есть повторяющийся сценарий, это сильный сигнал востребованности. Также помогают пользовательские интервью и быстрые A/B-тесты. Это возможно, но это не чтение мыслей, а прогнозирование на основе вероятностей. Аналитик смотрит на историю действий: покупки, частоту использования, сезонность и поведение похожих пользователей. На основе этих паттернов система предполагает следующие шаги. — Если продуктом регулярно пользуются без дополнительного подталкивания и есть повторяющийся сценарий, это сильный сигнал востребованности. Также помогают пользовательские интервью и быстрые A/B-тесты. Это возможно, но это не чтение мыслей, а прогнозирование на основе вероятностей. Аналитик смотрит на историю действий: покупки, частоту использования, сезонность и поведение похожих пользователей. На основе этих паттернов система предполагает следующие шаги. Например, Kaspi.kz прекрасно показывает, как эффективно использовать такие модели: персональные предложения, напоминания и рекомендации работают очень точно, повышая удобство сервиса для пользователей и увеличивая вовлечённость. Это сочетание машинного обучения, сегментации и данных в реальном времени. Важно понимать: эти системы не знают, чего именно ты хочешь. Они просто очень точно угадывают, основываясь на больших массивах пользовательского поведения.
— Можно ли с помощью аналитики «предугадывать» желания пользователей, как делают суперсовременные приложения?
— Основная «магия» все-таки в системах рекомендаций. Они анализируют поисковые запросы, клики, время просмотра и поведение похожих пользователей, поэтому довольно точно угадывают интересы. Иногда отдельные приложения или встроенные рекламные модули могут получать доступ к микрофону обычно через разрешение, которое пользователь сам дал, не особо задумываясь. Я не думаю, что это массовая прослушка, но такие случаи технически возможны. В итоге примерно на 80-90% это аналитика и машинное обучение, а остальное – серые способы сбора данных и эффект внимания. Поэтому иногда создается ощущение, что телефон «все слышит», хотя чаще всего он просто очень хорошо предугадывает поведение на основе данных.
— Насколько быстро аналитика должна реагировать, чтобы продукт не отставал от стремительно меняющихся запросов рынка и пользователей?
— Для критичных метрик важен почти реальный режим времени. Если падает конверсия, ломается воронка или растет число ошибок, команда должна видеть это сразу. Для продуктовых решений обычно достаточно ежедневного или недельного цикла. Главное, чтобы обратная связь была быстрой. Важно не столько наличие онлайн-дашбордов, сколько скорость реакции: заметили сигнал, сформулировали гипотезу, внесли изменения и снова измерили результат. Если этот цикл занимает месяцы, продукт начинает отставать от рынка и ожиданий пользователей.
— Данные называют «новой нефтью», но еще не до конца осознают их ценность. Какие возможности теряет бизнес?
— Компания теряет деньги, когда игнорирует аналитику. Но еще хуже, когда аналитика подключается слишком поздно: продукт уже запущен, деньги потрачены, а потом выясняется, что пользователям нужно другое. В итоге теряются рост, деньги и время, потому что данные могли подсказать правильное направление раньше, но к ним не прислушались. Также компания теряет возможности, когда собирает данные «на всякий случай», но не превращает их в действия. Метрики есть, а решений на их основе нет. Еще одна частая проблема – данные хранятся в разных системах, нет единой картины, и бизнес продолжает работать интуитивно, хотя мог бы опираться на факты.
— В условиях повсеместной цифровизации, ее законном урегулировании что стало проще, а что сложнее?
— Роль аналитика меняется. Раньше фокус был в основном на поиске инсайтов, сейчас он включает еще и корректную работу с данными в рамках регулирования: персональные данные, хранение, согласие пользователей, прозрачность алгоритмов. С технической стороны стало проще, появилось больше готовых инструментов, облачных решений, платформ для автоматизации и работы в реальном времени. Сложнее стало в части ответственности: нужно учитывать юридические ограничения, анонимизацию, объяснимость моделей, бандели и репутационные риски. Фактически аналитик все чаще находится на стыке бизнеса, технологий и комплаенса (с англ. compliance – соблюдение компанией законов, правил и внутренних стандартов — AR), а не только в зоне навыков и работы с дашбордами.
— Через 5 лет кто будет решать больше: данные или человек с интуицией?
— Думаю, через 5 лет решения все больше будут приниматься на основе данных, но последнее слово все равно останется за человеком. Модели отлично показывают, что происходит и что, вероятно, произойдет. Но только человек понимает контекст, риски и долгосрочные последствия. Аналитика уже сейчас формирует цифровой мир. Она влияет на то, какие продукты появляются, как выглядят интерфейсы, что мы видим в лентах и какие сервисы развиваются. По сути, данные задают направление, а человек отвечает за смысл. Без этого получается просто оптимизация метрик, а не создание реальной ценности.