
Данные общедоступны в соответствии с Creative Commons Attribution-NonCommercial-ShareAlike 4.0. Код, который используется для создания Tracker Radar, открыт на GitHub под лицензией Apache 2.0. Базу обещали пополнять ежемесячно.
Tracker Radar содержит подробную информацию о поведении отслеживания трекеров, в том числе о распространенности, принадлежности, действиях по снятию отпечатков пальцев, поведении файлов cookie, политике конфиденциальности, правилах для определенных ресурсов (за исключением случаев взлома сайта) и данные о производительности.
Каждый файл данных домена выглядит следующим образом:




Датасет содержит также файл для каждого родительского объекта, связывающий его с доменами.
Файл данных объекта выглядит следующим образом:


Так, исследователи нашли doubleclick.net на 29 758 сайтов (68%). Поскольку он принадлежит Google, у которого 479 доменов в собранном датасете, это означает, что doubleclick.net используется на сайтах, не принадлежащих Google, примерно 98% времени.
Согласно собранному датасету, трекеры, принадлежащие Google, находятся на более чем 85% топ-50 000 сайтов, Facebook - на 36%:

"Одна из лучших вещей, которую вы можете сделать, чтобы защитить себя, - это использовать качественный блокировщик трекеров. Хотя защита конфиденциальности сейчас важна для подавляющего большинства людей, наше исследование поведения, связанного с конфиденциальностью, показало, что только около 19% людей используют защиту от трекеров", -отметили в компании.
Изначально Tracker Radar сформировали для развития продуктов DuckDuckGo, которые необходимы для блокировки межсайтового трекинга. Он автоматически генерируется, постоянно обновляется и постоянно тестируется. По мнению компании, датасет заинтересует исследователей безопасности. Его уже используют разработчики Vivaldi.