BorisBurkov.net

Survival analysis - survival function, hazard rate, cumulative hazard rate, hazard ratio, Cox model
 June 11, 2021 8 min read

cover

Here I discuss the statistics apparatus, used in survival analysis and durability modelling.

Data structures for efficient NGS read mapping - suffix tree, suffix array, BWT, FM-index
 June 10, 2021 4 min read

cover

In Next-Generation Sequencing bioinformatics there is a problem of mapping so-called reads - short sequences of ~100 nucleotides - onto a full string that contains them - the reference genome. There is a number of clever optimizations to this process, which I consider in this post.

Gamma, Erlang, Chi-square distributions... all the same beast
 June 09, 2021 21 min read

cover

Probably the most important distribution in the whole field of mathematical statistics is Gamma distribution. Its special cases arise in various branches of mathematics under different names - e.g. Erlang or Chi-square (and Weibull distribution is also strongly related) - but essentially are the same family of distribution, and this post is supposed to provide some intuition about them.

Why Huffman trees require a bottom-up walk to be optimal?
 June 08, 2021 1 min read

cover

Why greedy algorithm wouldn't work for Huffman trees?

A case study of 20PiB Ceph cluster with 100GB/s throughput
 March 15, 2021 14 min read

cover

Recently we deployed a Ceph cluster that might be one of the more powerful in Russia in terms of both throughput and storage capacity. I'd like to discuss nuts and bolts of that system in this post.

Blog version 4
 July 13, 2019 1 min read

cover

I just released a new version of my personal blog http://borisburkov.net, this time powered by Gatsby.js.

Asyncio ecosystem
 March 29, 2019 4 min read

cover

I have a very bad developer experience with Asyncio. It is such a messy and overcomplicated system that I studied it over at least 3 times now. I figured, it's time to cut my losses and write a post about it!

Екатерина Шульман - лекция о российском социуме
 March 15, 2019 3 min read

cover

В сентябре мы с Андреем Попеску, Артемом Ломакиным и Женей Галимовым ели пиццу, лениво разглядывали задачки на Кеггле и трепались о разном. Спустя пару недель я сбросил в наш чатик лекцию Екатерины Шульман о влиянии АИ на социум.

Манчестер - хлопок и паровозы
 February 27, 2019 3 min read

cover

Подобно тому, как между современными инженерами из IBM, Google и Ригетти сейчас развернулась гонка за то, чтобы первыми достичь квантового превосходства, первые инженеры начала 19-ого соревновались в том, кому удастся произвести первый паровоз массового производства, который должен был курсировть между Манчестером и Ливерпулем.

DeepMind - Презентация AlphaFold в EBI
 February 07, 2019 5 min read

cover

Два месяца назад весь мир облетела новость, что DeepMind выиграл известное соревнование по предсказанию 3D-структур белков CASP, порвав всех биоинформатиков с впечатляющим отрывом. Многие люди из мира биотеха теперь пытаются осознать, 'что это было'? Революция или эволюция, наука или инженерия, талант или финансирование? Волею судеб я когда-то оказался совсем недалеко от этой области науки, поэтому потратил несколько дней чтобы разобраться в деталях - а между тем в EBI приехал наводить мосты ведущий инженер проекта Эндрю Сеньор из DeepMind.

Amazon Alexa
 February 07, 2019 4 min read

cover

Послушал двух парней из кембриджского офиса Амазона, работающих над Алексой. Составил общее впечатление о том, каково оно - работать в Амазон.

Prowler.io
 January 22, 2019 1 min read

cover

Побывал на презентации Prowler.io - самого модного кембриджского стартапа.

Focal loss and Average Precision
 November 12, 2018 2 min read

cover

A simple loss function for multiclass classification with multiple classes that beautifully deals with class imbalance

Встреча с Обри де Греем
 November 10, 2018 1 min read

cover

Поглядел наконец живьем на главного геронтологического оптимиста.

Карьера в империи данных - Лекция дата-инженера из Facebook
 October 23, 2018 1 min read

cover

Этой весной на ML/AI-конференции в Microsoft Research я коротко обсудил вопрос построения карьера дата-сайнтиста в IT-компаниях с Зубином Гарамани, профессором сильнейшего инженерного факультета Кембриджа и директором лабораторий искусственного интеллекта в Убер. Зубин тогда объяснил, что от ваших научных регалий обычно зависит та позиция, на которую вы устраиваетесь на работу, и роль в компании. И вот в это воскресенье я получил подтверждение его слов от Марека Романовича, дата инженера в Фейсбуке в Нью-Йорке.

20 примеров - как и на что живут РНК-биоинформатики?
 October 19, 2018 6 min read

cover

Только что прошел мой второй RNAcentral consortium meeting, и это было настолько интересное мероприятие с точки зрения понимания того, как устроен мир, что я не могу не поделиться этой информацией.

Postgres roles
 October 09, 2018 4 min read

cover

Postgres authentication and permission system sometimes feels like a total mess to me. This is a recap of how it works.

Docker users and user namespaces
 October 09, 2018 2 min read

cover

After taking a break from DevOps for a few months and switching to other fields, I would always forget the details of how users within a docker container map to users on the host machine. This is a condensed recap of user mappings that should save me time, upon switching the contexts.

Почему образование в США с 1985 по 2013 подорожало в 6 раз?
 February 02, 2018 8 min read

cover

Это краткий пересказ замечательной главы из книги Кэти О'Нил "Weapons of Math Destruction", посящённой тому, как большие данные углубляют социальное неравенство, концентрируют власть в руках капиталистов и делают обычного человека всё более беспомощным.

Мир МедТеха
 January 23, 2018 6 min read

cover

В конце прошлой недели я был на хакатоне по медицинской технике и получил массу знаний и впечатлений. Это совершенно другой мир, который живёт под девизом "Health & Wealth" и держится на патентах и контактах.

OpenStack, Kubernetes and OpenShift crash course for impatient - Kubernetes
 January 20, 2018 3 min read

cover

Kubernetes is a system for orchestration of containerized applications that can be used to deploy your microservice-based websites to the cloud. Kubernetes is created by Google, based on their internal orchestration system Borg (although, codebase is re-written completely from scratch). Kubernetes is written mostly in Go programming languages and is open-source.

OpenStack, Kubernetes and OpenShift crash course for impatient - OpenStack
 January 19, 2018 2 min read

cover

OpenStack is a pretty old standard for describing cloud resources and interacting with them. Most of its APIs were suggested around 2012. It is "Open" because multiple vendors that provide cloud services (including Rackspace and Red Hat) agreed to use the same API for interaction with them and called it OpenStack.

OpenStack, Kubernetes and OpenShift crash course for impatient - introduction
 January 18, 2018 2 min read

cover

Much like a junkie from a russian anecdote, who started shouting "Jiggers, cops!" when they brought him to the police station, EBI in 2018 suddenly discovered the existence of cloud technologies.

Traction
 December 17, 2017 60 min read

cover

MOST STARTUPS DON'T FAIL BECAUSE THEY CAN'T BUILD THE PRODUCT. MOST STARTUPS FAIL BECAUSE THEY CAN'T GET TRACTION.

BurkovBA.github.io is online!
 December 14, 2017 6 min read

cover

I've been procrastinating over my blog for almost a year. Initially I wrote it in Angular in early 2017 and re-wrote everything in React in the last couple of weeks. At last, following Github's "ship early - ship often" motto, I shipped it today. Probably the most challenging aspect of the whole work was to make Github pages play nice with React SPA - I'll tell you how in this post.

Энигма, часть 5 - "Бисмарк" и "дебютантка"
 November 30, 2017 2 min read

cover

В ходе "Битвы за Атлантику" в 41-ом году немецкий флот пытался отрезать Великобританию от морского сообщения с континентом и Штатами. У немцев было превосходство в военно-морском флоте, и на какое-то время им даже удалось установить вокруг островов морскую блокаду.

Back in Black - Памяти Малькольма Янга
 November 21, 2017 4 min read

cover

В течение последнего месяца умерли двое австралийских музыкантов - братья Джордж и Малькольм Янги. Если смерть Джорджа была мало кем замечена, то про Малькольма Янга сообщали во всех СМИ, ведь он - основатель легендарной австралийской рок-группы AC/DC."

Энигма, часть 1 - Что такое "Энигма"?
 November 01, 2017 2 min read

cover

Что вообще такое эта знаменитая "Энигма", которую все так стремились взломать, и зачем она была нужна?

Энигма, часть 0 - Британия во Второй мировой
 October 25, 2017 1 min read

cover

Прежде чем перейти собственно к теме повествования, криптографии и Блетчли-парк, я хотел сказать пару слов об участии Британии в войне - чтобы дать контекст.

Энигма. Анонс
 October 21, 2017 1 min read

cover

Все смотрели "Игру в Имитацию"? Камбербетч, конечно, прекрасен, а в жизни, конечно, всё было не так. Этот пост про математиков и инженеров из GC&CS (Government Code and Cypher School) во главе с Аланом Тьюрингом, нашедших уязвимости в немецких шифровальных машинах "Энигма" и "Лоренцå" во Вторую мировую войну, и спасших тем самым десятки или даже сотни тысяч соотечественников.

Facebook license
 September 25, 2017 2 min read

cover

Несколько дней назад Facebook изменил лицензии ряда самых популярных своих open-source библиотек React, Flow, Jest и Immutable.js на стандартную MIT.

Congenica
 September 21, 2017 5 min read

cover

Вчера был на семинаре основателей Congenica - компании, занимающейся медицинской генетикой врождённых болезней. Выступали двое из пяти или шести её основателей Ник Ленч и Энди Ричардс, и самое мощное впечатление произвёл Ричардс, с которым я после этого побеседовал.

Babraham Institute
 July 05, 2017 1 min read

cover

Как устроена жизнь простого российского мол. биолога я примерно представляю. Денег нет - денег нет - денег нет - денег нет - да ну нафиг, пойду в Мерк... \n Посмотрел, как она устроена у английского. В каком-то смысле совсем по-другому, в каком-то - точно так же...

Об овцах и стартапщиках
 January 05, 2017 3 min read

cover

Гербом Англии должны быть не три льва, а дюжина овец. Этим кротким созданиям она во-многом обязана своей индустриальной мощью, позволившей ей так вырваться вперед в общественном и экономическом развитии.