지난 3개월 동안 저는 기본 계층에 대해 각각 월 20달러의 가격이 책정되는 3개의 AI 스택을 실험했습니다. 나는 ChatGPT Plus로 시작한 다음 Perplexity Pro로 옮겼고 마침내 Gemini Advanced의 약속을 받아들였습니다. 나는 후자를 가장 오랫동안 고수했는데, 그 이유는 주로 내 작업 흐름의 필수적인 부분인 Gmail 및 Docs와 같은 다른 Google 제품과의 긴밀한 통합 때문이었습니다.
이제 Gemini와의 여정은 그다지 영광스럽지 않았으며 대부분의 경쟁 생성 AI 제품과 마찬가지로 딸꾹질도 상당히 많이 겪었습니다. 부정확성에 대한 문제가 너무 심해져서 구글의 순다르 피차이 최고경영자(CEO)는 이에 대해 사과해야 했습니다. 또한 연구원들은 오해의 소지가 있는 콘텐츠를 생성하고, 민감한 데이터를 유출하고, 심지어 악의적인 작업을 진행하기 위해 조작될 수 있는 방법을 독립적으로 선보였습니다. 잠시 동안 이러한 문제가 심각한 문제이고 일반 사용자는 그러한 문제에 직면하지 않을 것이라고 가정해 보겠습니다.
Google은 Gemini를 Google Assistant보다 더 유능한 대안으로 추진하고 있습니다. 그러나 현실은 다릅니다. 나는 받은 편지함 업무 속도를 높이고, 달력 일정을 처리하고, 작업 공간 활동을 감시하는 것과 같은 기본적인 작업을 위해 주로 Gemini를 밀었습니다. 그러나 포괄적인 웹 검색 대신 내 데이터만 확인하면 되는 완전히 잘못된 정보를 제공하는 속도로 인해 Gemini의 신뢰성과 일반적인 챗봇 업무 이상의 기능을 신뢰할 수 있는지에 대한 의문이 생겼습니다.
자신의 뒷마당에서 비틀거리며
Gmail은 제 작업 흐름에 통합되기를 희망하면서 Gemini를 실험하는 첫 번째 테스트 베드였습니다. 그러나 내가 발견한 것은 그것이 노골적으로 거짓말을 할 수도 있다는 것이었다. 위 이미지에서 볼 수 있듯이 Gemini에게 가장 최근의 FedEx 패키지 상태에 대해 물었습니다. 작년 배송에 대한 정보를 가져왔지만 내 받은 편지함에 있는 FedEx에서 보낸 24개 이상의 이메일에서 단 하나의 세부 정보도 가져올 수 없었습니다. 모든 이메일은 일주일 이내에 도착했습니다.
채팅 상자에 제공된 정보는 오래되었지만 추적 번호까지 부정확하지 않았습니다. 표시가 누락된 부분은 “FedEx 패키지에 대한 최신 업데이트”가 대략 3개월 전 통관 작업이었고, 단지 3분 전에 도착한 일련의 새로운 업데이트가 아니라 매일 최소 3통의 이메일 빈도로 자신있게 알려주는 것이었습니다. , 최소 일주일 전으로 거슬러 올라갑니다.
마찬가지로 나는 Gemini에게 “가장 최근의 캘린더 항목”에 대해 물었습니다. 1월 둘째 주에 내가 마감한 세 회의 회의에 대해 알려주는 대신 “당신의 달력에 어떤 일정도 표시되지 않습니다.”라고만 대답했습니다. 이것은 문맥상 부정확한 답변일 뿐만 아니라 “최근” 이벤트를 보는 대신 Gemini가 미래의 이벤트를 찾으려고 했기 때문에 완전히 잘못된 답변이기도 합니다.
내 캘린더 항목은 본질적으로 내 받은 편지함에 연결되어 있습니다. 받은 편지함 대시보드를 통해 직접 Google Meet 초대를 보내고 받습니다. Gemini의 모바일 및 데스크톱 버전에서 눈에 띄게 독립 실행형 도구로 나타남에도 불구하고 AI가 이벤트 확인과 같은 기본적인 것에 실수를 저지르고 대신 반대 방향으로 이동하여 쿼리 컨텍스트를 뒤집을 수 있다는 점은 놀랍습니다.
그럴까요? 그렇지 않습니까?
Gemini는 확장 시스템을 통해 다른 Google Workspace 앱 및 해당 데이터와 통합됩니다. WhatsApp과 같은 다른 앱과의 누화를 위해 유사한 파이프라인도 마련되어 있습니다. 그러나 경험상 개선의 여지가 많이 남아 있습니다. 사실, 긁어보세요. Google이 자사의 자연어 기술을 최고 중 하나로 자랑하고 있음에도 불구하고 Gemini는 때때로 짜증날 정도로 멍청할 수 있습니다.
가장 기본적인 수준부터 시작해 보겠습니다. 개인이나 그룹에 주소를 지정하기 위해 “@” 단축키를 사용할 수 있는 채팅 앱과 마찬가지로 Gemini도 작업을 완료하기 위해 올바른 Workspace 플랫폼을 선택하기 위해 동일한 단축키를 사용합니다. 글쎄, 가장 기본적인 쿼리에도 작동하지 않는 것 같습니다. 더욱이 다양한 플랫폼 간의 이해도 차이는 상황을 더욱 악화시킬 뿐입니다.
나는 쌍둥이자리를 불러내 여동생에게 “안녕” 인사를 보내라고 말했다. 심지어 “@” 단축키를 사용하고 작업을 실행할 대상으로 Gmail을 선택했습니다. AI 비서는 iPhone용 Gemini 앱에서 이를 거부했습니다. 비록 그것이 방금 전까지만 해도 잘 작동하여 긴 Gmail 체인에서 연구 논문에 대한 세부 정보를 가져왔음에도 불구하고 말이죠. Android 앱에서 Gemini는 무엇을 해야할지 결정할 수 없었습니다.
몇 분 만에 반응이 180도 바뀌었습니다. 첫 번째 시도에서는 메시지를 보내기 전에 내 받은 편지함의 “Saba”가 무엇인지 물었습니다. 두 번째 시도에서 똑같은 프롬프트를 사용하여 Gemini는 그렇게 할 수 없다는 이유로 집안일을 완전히 거부했습니다. 또한 통신 이력에 대해 추가로 제공한 정보도 완전히 거짓이었습니다.
기본에도 실패
현재 Gemini로 가장 간단한 작업이라도 수행하는 것은 AI 두더지 잡기 놀이를 하는 것과 같으며, Gemini가 휴대폰에서 작동하는지 확인하기 위해 지원 페이지를 자세히 살펴보아야 합니다. 한 달에 20달러를 지불함에도 불구하고 Gemini가 전화 걸기 같은 기본적인 작업을 수행할 수 없다는 것은 매우 짜증나는 일입니다. 안드로이드폰에서는 간단한 “Call XYZ @Phone” 명령으로 전화를 걸 수 있었습니다.
iOS에서 Gemini 앱은 전화를 걸 수 있는 “@Phone” 확장 프로그램을 지원하지 않습니다. 자, 잠시 동안 Apple이 개인 정보 보호 및 보안상의 이유로 전화 앱에 대한 AI 액세스를 허용하지 않을 것이라고 가정해 보겠습니다. 또한 Apple은 이미 OpenAI의 기술 스택을 활용하여 Siri의 새로운 아바타를 준비하고 있으므로 이러한 기본 기능을 자체 보조자에게 고정시키는 것이 합리적입니다.
하지만 WhatsApp과 같은 타사 통신 플랫폼은 어떻습니까? 글쎄요, WhatsApp에서 문자를 보내는 기능은 Android에서만 가능하며, Android에서는 챗봇의 “@Whatsapp” 단축키를 자유롭게 사용할 수 있습니다. iOS 앱에는 그런 사치가 없습니다. 심지어 “@Gmail” 확장 프로그램도 “지원할 수 없습니다”라는 응답을 반환합니다.
이것은 작은 실패가 아닙니다. Google의 어시스턴트가 이메일 전송과 같은 간단한 작업도 수행하지 못하고 타사 앱을 사용해도 플랫폼 게이트에 부딪히면 원활한 작업 공간 액세스 및 협업에 대한 공허한 약속으로 Gemini에 20달러를 지불하는 것은 거의 의미가 없습니다.