시시포스 데이터셋
증폭된 돌 이미지 1만장으로 이루어진 영상, 15분, 2020
인간의 자연에 대한 추출적 욕망을 드러내는 아이러니한 데이터셋.
인간에 의해 만들어진 모래산에서 옮겨온 둥근 돌들은 깨어진 특이한 외곽을 가지고 있다. 돌들은 인간의 추출적 욕망을 저장하고 있는 미디어이기도 하다. 한편으로 이 돌은 시시포스의 신화에서 굴러 떨어지는 그 '돌'을 생각하게 하는 돌이다. 즉 이것은 인간의 신화, 욕망, 여정을 벗어난, 돌의 입장을 보여주는 것이기도 하다. 이 돌들을 모아 인공지능을 학습을 시키기 위한 데이터셋으로 구성하고 '시시포스 데이터셋'으로 명명하였다.
인공지능의 추출적 기술에 쓸모가 있을 리 없는 이 '시시포스 데이터셋'을 구성하는 행위는, 마치 부재하는 것들을 들여다 보는 시선처럼 보이기도 하고, 쓸모 없음에서도 기어이 쓸모를 만들어 내어 다시 추출의 네트워크 속으로 밀어 넣는 행위로 보이기도 한다. 이 돌들은 인공지능을 위한 데이터 학습의 전처리 과정인 '데이터 증강'을 거치며, 25장에서 1만장의 데이터로 증폭되고, 기계 학습의 빠른 속도 속으로 흘러간다.
시시포스 데이터셋은 ‘존재하지 않는(부재하는) 데이터셋’을 구성하는 행위를 통해, '데이터셋 만들기'를 오히려 과거/현재의 기억을 비판적으로 유추하고 재구성하는 질문이 되게 할 수 없는가라는 질문을 담고 있다.
Sisyphus Dataset
25 broken stones and video consist of 10,000 augmented stone images
for machine learning, 15min, 2020
This "Sisyphus Dataset" consists of collecting the rounded stones from human-made sand dunes, which have broken and unique outlines and are also media that store human's extractive desires. On the other hand, these stones are reminiscent of 'the rock' that rolls down in the myth of Sisyphus. These stones were collected and organized as a dataset for learning artificial intelligence, and named "Sisyphus Dataset". This "Sisyphus Dataset" also demands to switch from a human-centered view to a stone's perspective of the Sisyphus myth. It is an ironic dataset that reveals the extractive desire of human nature.
*데이터셋(Dataset)
특정 목적으로 인공지능을 학습시키기 위해 사용하는 데이터의 더미이다. 수많은 데이터셋이 현재 존재하고 만들어 지고 있으며, 특정한 이름으로 명명되어 인공지능 학습을 위해 공유되고 있다.
*데이터 증강 (Data Augmentation)
인공지능 학습의 정확도를 높이기 위해 적은 데이터의 양을 부풀리는 전처리 과정. 이미지 비틀기, 사이즈 조정하기, 회전하기 등의 이미지 변형을 코드적으로 처리하여 이미지의 양을 인위적으로 증폭시켜 학습의 정확도를 높인다.
∞ 오픈코드. 공유지 연결망, 2021, 백남준아트센터