1. Требования к  обезличиванию   BigData Пермяков Руслан Анатольевич Руководитель офиса взаимодействия с  федеральными проектами и программами  развития АО Академпарк 
                                        
                                            10. Спасибо за внимание Пермяков Руслан Анатольевич +7(913)916 - 21 - 156 pra@yandex.ru 
                                        
                                            9. Требования 1. Реализация процесса гарантированного  обезличивания с верификацией без  участия человека. 2. Математически доказанная  невозможность реидентификации. 3. Законодательная возможность  обмениваться и продвать датасеты в  обезличенной форме в стране и  зарубежом без получения согласия  третьих лиц. 
                                        
                                            6. Угрозы личности и обществу 1. Идентификация на основе поведнческой  модели 2. Дискриминация на основе  интрепритации данных 3. Восстановление составляющих тайну  личности (медицинские данные, тайна  усыновления и т.п.) на основе  публичных данных. 4. Непредсказуемость последствий  предоставления данных для личности в  связи с равитием технологий анализа.  
                                        
                                            7. Разработанные        методики позволяют получать оценку состояния  здоровья не только в текущий момент времени, но и получать прогноз его  состояния в будущем, в частности, трудового потенциала, рисков смерти и  продолжительности жизни.  Такие прогнозы важны не только для человека лично, но и для руководителей  разных уровней, а также высоко востребованы в настоящее время страховыми  компаниями, разрабатывающими персонализированные страховые продукты. Как решается  сейчас  
                                        
                                            4. Обезличивание Обезличивание персональных данных  – дейсвтия, в  результате которых становиться невозможным без  использования дополнительной информации определить  принадлежность персональных данных конкретному  субъекту. Деобезличивание – дейсвтия, в результате которых  обезличенные данные принимают вид, позволяющий  определить их принадлежность конкретному субъекту  персональных данных. Деидентификация - это процесс, используемый для  предотвращения раскрытия чьей - либо личности .  
                                        
                                            3. Приватность : Alan Westin  в 1967 году определил приватность  как: • Одиночество  - физическое отделение от других • Интимность  – «близкие и откровенные отношения между двумя или  более лицами», которые могут возникнуть из уединения • Анонимность  - свобода от идентификации и наблюдения в  общественных местах • Скрытность  - создание психологического барьера против  нежелательного вторжения 
                                        
                                            5. Как решается  сейчас  С 1 июля 2020 года провести в субъекте Российской Федерации  - городе  федерального значения Москве эксперимент по установлению специального  регулирования в целях создания необходимых условий для разработки и  внедрения технологий искусственного интеллекта в субъекте Российской  Федерации  - городе федерального значения Москве, а также последующего  возможного использования результатов применения искусственного интеллекта. часть 1 статьи 6 дополнить пунктом 9.1 следующего содержания: "9.1) обработка персональных данных,  полученных в результате обезличивания персональных  данны х, осуществляется в целях повышения эффективности государственного или муниципального  управления, а также в иных целях, предусмотренных Федеральным законом "О проведении  эксперимента по установлению специального регулирования в целях создания необходимых условий  для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации  - городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона  "О персональных данных", в порядке и на условиях, которые предусмотрены указанным  Федеральным законом;"; статья 10 дополнить частью 2.1 следующего содержания: "2.1. Обработка персональных данных,  касающихся состояния здоровья ,  полученных в результате  обезличивания персональных данных , допускается в целях повышения эффективности  государственного или муниципального управления, а также в иных целях, предусмотренных  Федеральным законом "О проведении эксперимента по установлению специального регулирования  в целях создания необходимых условий для разработки и внедрения технологий искусственного  интеллекта в субъекте Российской Федерации  - городе федерального значения Москве и внесении  изменений в статьи 6 и 10 Федерального закона "О персональных данных", в порядке и на условиях,  которые предусмотрены указанным Федеральным законом.". 
                                        
                                            2. Большие данные Объем Количество данных  — важный фактор. Располагая ими в больших количествах, Вам  потребуется обрабатывать большие объемы неструктурированных данных низкой  плотности. Ценность таких данных не всегда известна. Это могут быть данные каналов  Twitter,  данные посещаемости веб - страниц, а также данные мобильных приложений,  сетевой трафик, данные датчиков. В некоторые организации могут поступать десятки  терабайт данных, в другие — сотни петабайт. Скорость Скорость в данном контексте  — это скорость приема данных и, возможно, действий на  их основе. Обычно высокоскоростные потоки данных поступают прямо в оперативную  память, а не записываются на диск. Некоторые "умные" продукты, функционирующие  на основе Интернета, работают в режиме реального или практически реального  времени. Соответственно, такие данные требуют оценки и действий в реальном  времени. Разнообразие Разнообразие означает, что доступные данные принадлежат к разным типам.  Традиционные типы данных структурированы и могут быть сразу сохранены в  реляционной базе данных. С появлением  Big Data  данные стали поступать в  неструктурированном виде. Такие неструктурированные и  полуструктурированные типы данных как текст, аудио и видео, требуют дополнительной обработки для  определения их значения и поддержки метаданных. обозначение структурированных и неструктурированных данных огромных  объёмов и значительного многообразия, эффективно  обрабатываемых горизонтально масштабируемыми программными инструментами 
                                        
                                            8. Как это видит математик Идентификация на основе персональных  данных: 풀 : 풇 푿 = Y, • ∀ 풙 ퟏ , 풙 ퟐ ∈ 푿 , таких ,  что 푓 풙 ퟏ = 푓 풙 ퟐ ⟹ 풙 ퟏ = 풙 ퟐ , где Х – мнодество данных идентифицирующих субъекта , Y  – множество даных Обезличенные данные: 풀 : 풇 푿 = Y, ∃ 풙 ퟏ , 풙 ퟐ ∈ 푿 , такие, что 푓 풙 ퟏ = 푓 풙 ퟐ , 풙 ퟏ ≠ 풙 ퟐ , где Х  – мнодество данных идентифицирующих субъекта,  Y  – множество  даных