banner

소식

May 16, 2023

Raspberry Pi 카메라는 소리를 사용하여 AI로 사진을 만듭니다.

그게 무슨 소리야? 이 블라인드 카메라를 보여주세요!

천 마디 말보다 한 장의 그림이 그림의 가치가 있다고들 하지만, 천 마디 말이 그림 한 장의 가치가 있을까요? 제작자이자 개발자인 Diego Trujillo Pisanty는 Raspberry Pi 기반 블라인드 카메라 프로젝트를 통해 이를 알아내려고 했습니다. 사진을 찍기 위해 빛을 포착하기 위해 렌즈를 사용하는 대신, 소리를 듣고 감지된 오디오를 기반으로 주변에 있을 수 있는 것에 대한 대략적인 구성을 구성합니다.

이 장치는 캡처하려는 대상에 카메라를 겨냥하고 버튼을 눌러 이미지를 생성한다는 점에서 일반 카메라와 유사하게 작동합니다. 하지만 이 경우에는 소리 캡처를 증폭시키는 데 도움이 되는 거대한 뿔이 전면에 있습니다. 사용자는 버튼을 누르기 전에 캡처하려는 방향으로 이 경적을 조준해야 합니다. 그런 다음 카메라는 AI 필터를 통해 오디오를 구문 분석하고 이미지를 생성합니다.

Pisanty에 따르면 그는 이 프로젝트를 위해 맞춤형 인공 신경망(ANN)을 개발했습니다. 그는 멕시코 시티 주변에서 촬영한 일련의 비디오를 기반으로 한 자신의 모델로 AI를 훈련시켰습니다.

이 모델은 비디오의 각 프레임을 가져와서 오디오의 마지막 순간을 첨부하여 만들어졌습니다. 이는 시스템이 이미지를 생성하는 데 사용할 수 있는 사운드와 비디오의 연결을 구축하는 데 도움이 되었습니다. 이러한 방식으로 훈련되었기 때문에 생성되는 모든 것은 느슨하게 멕시코 시티의 도심 이미지를 기반으로 합니다.

이 프로젝트에서 Pisanty는 Raspberry Pi 3B 모듈을 사용하고 있습니다. 그러나 Raspberry Pi 4를 사용하여 다시 만드는 것은 가능합니다. Pi가 Tensorflow를 처리할 수 있는 한 작동할 것입니다. 카메라에는 일종의 뷰파인더 역할을 하는 작은 화면도 있습니다. 이미지가 처리되는 시기를 사용자에게 알려주고 생성된 이미지의 미리보기를 제공합니다. 모든 것이 맞춤형 3D 프린팅 쉘 내부에 보관됩니다.

시각 장애인 카메라 훈련에 사용된 AI 모델은 Python 3을 사용하여 생성되었습니다. Tensorflow 2와 함께 작동하도록 설계되었으며 TFLite를 사용하여 Raspberry Pi에서 실행됩니다. 이 Raspberry Pi 프로젝트를 다시 만들고 싶거나 프로젝트가 어떻게 진행되는지 자세히 살펴보고 싶다면 Pisanty가 YouTube에 공유한 비디오를 확인하고 그의 웹 사이트에서 프로젝트에 대한 자세한 내용을 읽어보세요.

열정적인 PC 기술 뉴스에 대한 내부 트랙을 보려면 Tom's Hardware를 읽고 25년 이상 경력을 쌓아온 전문가와 함께 하세요. CPU, GPU, AI, 제조업체 하드웨어 등에 대한 최신 소식과 심층 리뷰를 받은 편지함으로 직접 보내드립니다.

Ash Hill은 Tom's Hardware US의 프리랜스 뉴스 및 특집 작가입니다. 그녀는 이달의 Pi 프로젝트와 일일 Raspberry Pi 보고의 대부분을 관리합니다.

Raspberry Pi 야간 투시경 고글을 사용하면 밤에도 볼 수 있습니다.

Seeed, 10인치 reTerminal DM Raspberry Pi 올인원 발표

Runway의 강력한 Gen-2 텍스트-비디오 도구를 이제 모든 사람이 무료로 사용할 수 있습니다.

Ash Hill 작성2023년 6월 7일

By Les Pounder2023년 6월 7일

스튜어트 벤들(Stewart Bendle) 작성2023년 6월 7일

Ash Hill 작성2023년 6월 7일

Jarred Walton 저 2023년 6월 6일

Aaron Klotz 작성2023년 6월 6일

Anton Shilov 작성2023년 6월 6일

Zhiye Liu 작성2023년 6월 6일

Anton Shilov 작성2023년 6월 6일

Mark Tyson 작성2023년 6월 6일

Aaron Klotz 작성2023년 6월 6일

공유하다