Семейная история мирового масштаба. Как MyHeritage изменил генеалогию?
2020-06-03 18:00
Изучение своих корней объединяет людей по всему миру, и уже сейчас становится понятно, что генеалогия будущего выйдет на более высокий уровень объединения. Можно ли создать общее древо для всех жителей Земли?
В своей лекции на форуме ГЕНТЕХ 2018 руководитель отдела дизайна пользовательских интерфейсов MyHeritage Андрей Овруцкий рассказывает о том, как компания вывела генеалогию на новый технологический уровень.
Я своё выступление хотел бы начать с небольшой истории.
Рига, 1946 год. Город возвращается к жизни после Второй мировой войны. В этом городе Семён и Ася пытаются наладить свою жизнь. Война защитила их, но уничтожила семьи обоих. Семён потерял жену и троих детей, а Ася потеряла мужа и двоих детей. Но у них в январе 1947 года рождается сын Лев. На этом их горести не заканчиваются: через несколько недель после родов Ася умирает из-за осложнений. Отец снова женится. В общем-то Лев живет с приёмной матерью, даже не зная об этом. Отец ему рассказывает реальную историю, и когда ему исполняется 16 лет, Лев понимает, что он не знает свою реальную историю, половина семейного древа от него скрыта.
Он носит эту историю в себе и уже во взрослом возрасте рассказывает своей дочери Жанне. Та, в отличие от него, решает всё-таки докопаться до истины. Она регистрируется на сайте MyHeritage и создаёт своё генеалогическое древо. Через некоторое время она получает письмо о том, что у неё есть совпадения. После переписки с человеком, который был «совпадением», она выясняет, что тот, кто написал ей, — это двоюродный брат её отца. Таким образом, она узнаёт действительно вторую линию — ту часть, которую отец не знал о себе. Также выясняется, что у его матери, у бабушки Жанны, довольно большая ветвь родственников. О них вообще из семьи Льва никто не знал до этого. Счастливым завершением этой истории становится то, что Жанна собирает всех родственников, которые живут уже в разных странах, вместе. И на этой встрече её отец впервые вживую встречает своего двоюродного брата.
Я — Андрей Овруцкий, и я работаю в MyHeritage. Эту историю я рассказал потому, что у меня точно так же, как у Жанны, есть вопросы. Я не знаю, кто мой дед. Есть моё древо. Есть я. А ещё в древе есть человек, которого я пока не нашёл. И в MyHeritage я работаю не только потому, что это хорошая компания, а потому что я хочу, чтобы наш продукт был самым лучшим.
Что же такое MyHeritage?
MyHeritage — это компания единомышленников и людей, которые любят заниматься генеалогией и стараются сделать этот продукт лучше всех. И в принципе, мы довольно часто встречаемся с такими историями, как та, которую я рассказал. Это история реальных людей. Мы всегда стараемся им помочь. Например, мы запустили проект, позволяющий приёмным детям по всему миру найти своих биологических родителей. Мы уже раздали 5 тысяч тестов ДНК бесплатно, и сейчас готовится второй раунд этого проекта.
Каждый год мы собираем команду из наших работников и отправляем экспедицию в разные уголки мира. Они изучают и сохраняют генетическую историю разных племён, которые могут исчезнуть. Мы уже побывали в Намибии, в Папуа-Новой Гвинее, в Сибири, в Ненецком автономном округе. В течение 16 дней мы создавали и комментировали биологические древа более трёх тысяч ненцев.
На данный момент готовится четвёртая экспедиция, но это капля в море, если посмотреть на всю фирму в целом. По некоторым из наших цифр, у нас зарегистрировано 102 миллиона пользователей по всему миру, создано 40 миллионов генеалогических древ. В этих древах находится 3 миллиарда персон. В наших базах данных зарегистрировано 9 миллиардов архивных записей, мы уже сделали два с половиной миллиона тестов ДНК. Наши пользователи ежедневно получают десятки миллионов совпадений, генетических и биологических — по всему миру.
Но давайте вернёмся обратно к нашему продукту. Мы стараемся создавать новые инструменты и улучшать старые. Что касается самой генеалогии древа, то у нас долгое время был только вид в виде древа. Недавно мы добавили древо в виде родословной, и в ближайшее время будем улучшать вид и функциональность списка. Также за последний год мы добавили 523 миллиона архивных записей. Мы работаем с архивами на территории бывшего Советского Союза, здесь идёт довольно сложная работа. Я надеюсь, что в следующем году смогу представить какую-нибудь из коллекций, которая больше актуальна пользователям в России.
Нами создана коллекция выпускных альбомов, которая будет интересна не только профессионалам. В ней много людей, которые известны всем. Есть, например, выпускной альбом Билла Клинтона 1963 года, альбом Стива Джобса 1972 года, Чака Норриса 1958 года. Кроме того, можно найти Джулию Робертс, Натали Портман, Шерон Стоун.
Каков интерфейс проекта MyHeritage?
Кроме работы с коллекциями, самими архивами, мы также работаем над улучшением интерфейса. В ближайшее время будет изменён интерфейс показа результатов поиска в каждой отдельной коллекции. Мы сделали уже 2 миллиона тестов. Мы поддерживаем форматы ведущих фирм. Только сейчас общались с представителем Genotek — может быть, в дальнейшем тоже попытаемся поработать с ними. Посмотрим, как получится.
Мы заново разработали всю технологию работы с ДНК. Создали новые страницы обзора ДНК, в которой можно увидеть этническое происхождение, совпадения ДНК и другую информацию. Улучшили поиск по данным в совпадении ДНК, добавили новые категории для поиска, чтобы было удобно, потому что большие объёмы. Некоторые получают 1000 совпадений.
На самой странице «Совпадения» появились новые функции — такие, как фамилия предков, общая фамилия предков, общие места проживания между двумя людьми. Также появилась возможность делать обзор хромосом с очень мощной функциональностью между несколькими, двумя людьми и более, добавлять и изучать хромосомы на более высоком уровне.
Все эти инструменты мы объединили в единую область, которую можно посмотреть, взять каждую в отдельности и проработать. Когда мы всё это собрали, мы подумали: у нас большое количество информации, архивов, инструментов. А как мы можем сделать переход на новый уровень в изучении генеалогии?
И тогда у нас появилась идея создать проект «Теория большого древа».
Представьте себе, что вы создаёте своё генетическое древо. Вы обзвонили всех родственников, обошли все архивы и изучили все фотографии, письма. И даже сделали анализ ДНК. И вот у вас появилось совпадение по ДНК. Появляется описание этого человека: «Двоюродная родственница с разницей в два поколения». Никому это ни о чём не говорит. Как узнать точно, где находится этот человек?
Для того, чтобы найти связь между вами, нам нужно подняться вверх до общего предка, а потом опуститься к тому человеку, с которым у вас есть совпадения. Единственная проблема в том, что такого древа не существует. Но зато у нас есть, благодаря нашим древам, архивам, работе с партнёрами, много маленьких древ. И мы их соединили вместе.
Методом поиска совпадений, которые есть между этими древами, мы создаём путь. Мы можем прийти по этому пути от одного древа к другому. В упрощённой форме древа можно подняться вверх к общим предкам и потом спуститься вниз. Но чтобы показать людям, как мы пришли к этому результату, мы добавили расширенный интерфейс. В нём можно увидеть полностью все источники и места перехода от одного источника к другому. По совпадению переходим к другому древу, от него можем перейти, в данном случае, на сайт нашего партнёра.
Также это может быть архив, перепись населения или свидетельство о рождении и другие документы, в которых указаны несколько родственников. И вот мы переходим по нашим предкам дальше, чтобы двигаться в сторону нашего совпадения. В какой-то момент у нас заканчивается цепочка, мы дальше не можем спускаться. Тогда мы переходим на древо другого человека, который его создал. Таким образом, приходим к нему, к нашему совпадению и объединяем двоих людей.
Таким образом, MyHeritage попыталась объединить всю собранную информацию: техническую, технологическую, архивные древа и всё, что у нас есть — для того, чтобы сделать новый скачок в области генеалогии на благо нашим пользователям.
Что посмотреть?
Выступление Андрея Овруцкого на форуме ГЕНТЕХ 2018