이 문서의 목적은 2024 솔루션 챌린지의 제출 양식(2024년 1월 21일 공개) 기준에 대한 안내를 제공하는 것입니다.
제출 세부사항 : 팀당 1명의 대표자(GDSC 회원이어야 함)가 제출서를 작성해야 합니다. 해당 양식은 팀에 대한 일반적인 질문(팀 연락처, 솔루션명, 대학교 정보, 팀이 참여한 이벤트), 일반 프로젝트 정보(SDGs 초점, 활용된 구글 기술, 구글 제품/플랫폼 피드백), 세부 프로젝트 정보(심사/제출 기준, 데모 비디오 링크, GitHub 링크)를 포함합니다.
이 문서는 제출 기준, 데모 비디오 가이드라인 및 GitHub 가이드라인과 같은 양식의 다음 영역에 대한 지침을 제공합니다.
참고: 이러한 기준은 판단 기준과 동일하며, 개발 라이프사이클에 따라 재구성된 것입니다.
총 11문항(평가X 1문항) / 각 1500자 (영문)
사용한 구글 제품 및/또는 플랫폼에 대해 어떤 피드백을 가지고 있습니까? 해당 기술에 대해 추가하고 싶은 기능이 있습니까? 참고: 귀사의 답변이 솔루션 채점에 어떠한 영향도 미치지 않습니다
GCP의 VM 인스턴스와 translation api, gemini를 사용해보았습니다.
먼저 vm 인스턴스는 다양한 유형이 있어 원하는 사양의 인스턴스를 선택할 수 있어 좋았지만, 가격이 조금 비싸게 느껴졌고 생성, 관리할 때의 사이트 UI가 복잡해 힘들었습니다.
translation api와 gemini는 뛰어난 성능으로 프로젝트에 적용해 좋은 효과를 얻었지만, 가이드 문서가 불친절하여 개발에 어려움이 있었습니다.
We have used GCP's VM instances, Translation API, and Gemini.
Firstly, the variety of types offered by VM instances for selecting instances with desired specifications is great. However, we found the pricing to be a bit high, and the page UI for creation and management was complex and challenging.
In the case of Translation API and Gemini, their excellent performance positively impacted the project. However, the documentation was not user-friendly, leading to difficulties in the development process.
당신의 팀은 어떤 Gemini 제품을 사용했고, 각 제품이 어떻게 유용했는지 알려주세요.
저희 팀은 Vertex AI의 Gemini API를 사용했습니다. 메뉴판 사진으로부터 텍스트를 인식하여 음식명과 가격을 추출하는 기능에 사용하였습니다.
구글의 Cloud Vision API 등의 OCR을 직접 사용하는 방법도 있었지만, 추출된 텍스트로부터 음식명과 가격을 매칭시키는 과정이 추가로 필요했습니다. 하지만 식당의 메뉴판은 각각 다른 구조로 디자인돼있어 이를 매칭시키는 알고리즘을 짜는 것은 쉽지 않았습니다. 그래서 오랫동안 조사하고 고민한 끝에 Gemini를 사용해서 OCR과 음식명, 가격 매칭까지 구현하기로 결정하였습니다.
우리의 솔루션에 적용해서 테스트해본 결과, Gemini가 음식명과 가격을 효과적으로 추출하는 것을 확인하고 실제로 프로젝트에 적용하였습니다.
Our team used the Vertex AI Gemini API to extract food names and prices from menu photos.
While there are direct methods, such as using Google's Cloud Vision API for OCR, they necessitate an additional step to match the extracted text with food names and prices. Designing an algorithm for this task proved challenging due to the diverse structures of restaurant menus. After extensive research and consideration, we opted to implement OCR and matching for food names and prices using Gemini.
During the testing phase, we confirmed that Gemini effectively extracts food names and prices. Subsequently, we successfully applied it to our project.