우리가 직면하게 될 AI 개발 문제를 해결하는 방법
게시 됨: 2020-04-02기존의 기존 소프트웨어 개발 환경의 대부분은 분석, 계획, 설계, 구축, 품질 보증 및 배포를 포함하는 일반적인 단계를 따릅니다.
그러나 인공 지능의 개발 환경은 다르게 작동합니다. AI 프로젝트의 경우 데이터 소스를 식별하고 데이터를 수집하여 정제하고 인사이트로 전환하는 것을 중심으로 개발이 진행됩니다. 이러한 접근 방식에는 다른 사고 방식과 기술이 필요합니다.
인공 지능 프로젝트 에 네트워크로 연결된 이 틀에 얽매이지 않는 방식은 인공 지능 개발 문제를 해결하는 방법에 대한 완전히 새로운 일련의 문제와 답변을 제공 합니다 .
우리의 인공 지능 개발 전문가 팀은 동일한 산업에 속하는 2개를 제외하고 약 7개의 본격적인 솔루션과 17개 이상의 POC에 대해 작업했습니다. 작업 노출은 우리에게 몇 가지를 매우 명확하게 했습니다.
- AI 소프트웨어 개발 프로젝트 결과가 기존 제품과 같을 것이라고 기대할 수는 없습니다. AI를 사용하면 게임이 히트와 시도에 더 가깝기 때문입니다.
- 기술 전문가뿐만 아니라 전체 팀이 참여할 때 비즈니스에서 AI 전략 및 프로그램을 가장 잘 구현할 수 있습니다.
- 비 AI 앱 프로젝트의 경우와 마찬가지로 AI 프로젝트의 경우에도 아이디어마다 한계가 다릅니다. 그러나 제품 전반에 걸쳐 유사한 AI 개발 과제와 솔루션 이 있습니다.
세 번째 학습을 살펴보면 어떤 아이디어가 뒷받침하는지에 상관없이 제품 간에 유사한 문제가 있습니다. 우리가 개발 중인 애플리케이션에 관계없이 이러한 문제가 발생하여 이러한 문제가 반복적으로 발생한다고 가정하는 것이 안전합니다.
기업가의 적극적인 접근 방식을 흡수하기 위해 데이터 엔지니어는 AI 개발 서비스 를 채택할 때 일반적으로 발생하는 문제를 모든 개별 인공 지능의 어려움과 기회에 대한 통찰력과 함께 나열했습니다.
AI 개발 과제 및 솔루션
1. 데이터 수집 및 관리 문제
AI 시스템이 기반으로 하는 데이터만큼만 우수하다는 진술은 일반적이지만 몇 가지 고유한 문제가 있습니다. 이 전선에서 발생하는 문제는 주로 데이터 수집 및 개선과 관련된 것입니다. 그러나 다음과 같은 다른 과제도 있습니다.
가. 데이터의 질과 양
위에서 언급했듯이 AI 시스템의 품질은 시스템에 공급되는 데이터의 양과 품질에 크게 좌우됩니다. 패턴을 식별하고 예상대로 행동하기 위해서는 AI가 양질의 데이터를 많이 필요로 합니다.
Appinventiv에서는 보유한 데이터와 모델이 작동하는 데 필요한 데이터를 나열하여 AI 전략 및 프로그램을 구현하는 프로세스를 시작합니다. 이를 위해 개방형 데이터와 Google의 데이터세트 검색을 모두 사용하여 모델 학습에 도움이 되는 데이터에 액세스합니다.
데이터 레이블 지정
몇 년 전까지만 해도 대부분 의 데이터는 텍스트로 구성되어 있었습니다. 그러나 옴니채널 고객 경험과 사물 인터넷의 시작과 함께 비즈니스 시스템에 제공되는 데이터 유형은 대부분 구조화되지 않았습니다. 문제는 대부분의 AI 시스템이 감독된 데이터 세트를 해결하도록 훈련되었다는 것입니다.
Appinventiv 에서는 AI 개발 문제를 해결하는 방법에 답할 때 데이터 프로그래밍 및 합성 레이블링, 피드백 루프 시스템 등을 중심으로 데이터 레이블링을 처리하기 위해 여러 접근 방식을 사용합니다 .
데이터 편향성
AI가 편향된다는 이야기는 널리 퍼져 있습니다. 문제는 특히 기술이 의식이 없으므로 나쁜 의도를 가질 수 없기 때문에 어떻게 그런 일이 발생합니까?
편향은 잘못 수집된 데이터에서 조장됩니다. 이것이 결론입니다. 데이터 소스가 편향되면 시스템이 차별적입니다.
우리는 모든 데이터를 검토하여 처음부터 편견이 없는지 확인합니다. 이런 식으로 AI 시스템에 들어갈 때 그림에 편견의 범위가 없습니다.
사례 중심 학습
인간 지능은 한 분야의 경험을 다른 분야에 적용할 수 있게 해줍니다. AI가 쉽게 처리할 수 있는 일이 아닙니다.
비즈니스용 AI 기반 도구 는 전문화되어 있습니다. 한 손으로 작업을 수행해야 합니다. 핵심 복잡성으로 인해 AI가 한 프로젝트에서 파생된 경험을 다른 프로젝트에서 사용하는 것은 매우 어려울 수 있습니다.
우리 는 AI 모델을 훈련시켜 작업을 수행한 다음 유사한 활동에 학습을 적용하는 Transfer Learning 접근 방식을 사용합니다. 작업 A를 위해 고안된 모델이 나중에 작업 B 모델의 시작점으로 사용될 수 있음을 의미합니다.
2. 사람 중심의 이슈
AI가 널리 채택되고 있는 와중에도 해당 기술을 편안하게 다룰 수 있는 인적 자원은 포함됩니다. 이는 결과적으로 기업이 AI 기반 애플리케이션 을 만들 때 장단기적으로 여러 가지 지속적인 문제를 야기합니다 .
비기술직 직원의 이해 부족
AI 구현을 위해서는 경영진이 AI 기술, 그 기회 및 한계 등을 이해해야 합니다. 노하우가 없으면 실제로 영향을 미칠 수 있는 비즈니스에서 AI를 올바르게 채택하는 데 방해가 됩니다.
현장 전문가의 희소성
AI 산업에 필요한 것은 AI 문제 및 기술에 대한 기술적 이해와 시장 노하우가 조화된 전문가입니다 . 문제는 특히 FAMGA 그룹이 AI 소프트웨어 개발에 필요한 핵심 기술을 갖춘 인재를 고용하는 경우 두 가지가 혼합된 풀타임 사내 리소스를 찾는 것이 정말 어렵다는 것입니다.
이것이 기업에서 AI 솔루션 개발 을 산업에 대한 심층 지식을 갖춘 전문가 팀으로 구성된 당사와 같은 AI 앱 개발 회사에 자주 아웃소싱하는 가장 큰 이유 입니다.
3. 통합 과제
현재 시스템에 인공 지능을 추가하거나 통합 하는 것은 브라우저에 플러그인을 추가하는 것보다 훨씬 더 복잡한 프로세스입니다. 비즈니스 요구 사항을 해결하기 위해 설정해야 하는 여러 요소와 인터페이스가 있습니다.
당사의 데이터 과학자 팀은 개별 데이터 인프라 요구 사항, 데이터 레이블 지정, 저장 및 시스템에 데이터를 공급하는 프로세스를 고려하므로 시작 AI 앱 구현 문제 에 직면할 필요가 없습니다 . 우리는 또한 모델을 훈련하고 AI의 효율성을 테스트하여 사람들의 행동을 기반으로 모델을 개선하기 위한 피드백 루프를 개발합니다.
4. 인프라 기능
기업이 AI 솔루션을 배포하는 데 데이터 및 데이터 처리, 계산, 저장, 확장성, 보안, 확장성 등이 모두 필요합니다. AI 솔루션을 배포할 때 비즈니스의 성공은 인프라 환경이 얼마나 적합한지, 워크로드 및 AI 애플리케이션을 얼마나 잘 지원하는지에 대한 답에서 시작됩니다. 슬프게도 그 대답은 가장 큰 엔터프라이즈 AI 과제 중 하나이기도 합니다 .
비즈니스 분석가가 초기 단계에서 주의해야 할 몇 가지 사항이 있습니다.
- 딥 러닝 및 머신 러닝 모델을 지원하기 위한 고속 스토리지 및 처리 기능의 올바른 조합.
- 기본 하드웨어에 맞게 최적화 및 조정할 수 있는 최고의 소프트웨어입니다.
- 대부분의 움직이는 구성 요소와 부품을 관리하는 인터페이스입니다.
- 최적화된 성능을 위해 클라우드 또는 온프레미스 데이터 센터에 배포할 수 있는 인프라입니다 .
5. 멀티태스킹 능력 부족
딥 러닝 모델은 매우 훈련 가능합니다. 교육이 끝나면 솔루션이 개체 식별이든 고객의 검색 기록을 기반으로 제품 추천이든 관계없이 가장 잘 작동한다는 것을 확신할 수 있습니다.
이것은 시스템이 멀티태스킹을 원할 때 AI에서 가장 큰 문제 중 하나입니다 . 예를 들어 AI가 비디오에서 사람을 식별하고 백그라운드에서 재생되는 노래의 출처를 추적하도록 하면 효율성이 손실됩니다.
우리 데이터 엔지니어들이 확인한 이 문제에 대한 해결책은 점진적 신경망 을 사용하는 것입니다 . 개별적인 딥러닝 모델을 작은 정보도 쉽게 전달할 수 있는 방식으로 연결하는 것을 의미합니다. 우리는 아직 모델을 실제로 적용하지 않았지만 이 방법은 로봇 팔 개발에 매우 유용한 것으로 입증되어 몇 주에서 단 하루로 학습 속도를 높입니다.
이것은 AI 개발 과제와 솔루션에 대한 우리의 견해였습니다. 그러나 AI 개발 어려움을 극복하기 위한 팁은 이것으로 끝나지 않습니다. AI 프로젝트 고안 및 배포 세계에 대해 깊이 파고들면 비즈니스에 대한 해답을 제공하고 해결하기 위한 AI 문제의 구현이 궁극적으로 파트너가 된 인공 지능 개발 회사가 보유한 기술 및 비즈니스 이해도에 달려 있음을 알게 될 것입니다.
6. 인간 수준의 상호 작용
이것은 아마도 AI의 주요 과제일 것입니다. 이는 조직 및 신규 비즈니스에서 AI 서비스를 위해 에지에서 연구원을 구한 것입니다. 이러한 조직은 90% 이상의 정확성을 자랑할 수 있지만 사람들은 이러한 모든 상황에서 개선할 수 있습니다. 예를 들어, 우리 모델이 사진이 개인지 고양이인지 예측하게 하십시오. 인간은 99% 이상의 놀라운 정확도를 지워 매번 올바른 출력을 예측할 수 있습니다.
심오한 학습 모델이 유사한 성능을 발휘하려면 강력한 처리 능력, 기차 데이터에 대한 지속적인 교육 및 테스트 데이터에 대한 테스트와 함께 놀라운 미세 조정, 하이퍼파라미터 개선, 거대한 데이터 세트, 잘 정의되고 정확한 알고리즘이 필요합니다. 그것은 많은 작업처럼 들리지만 실제로는 보이는 것보다 몇 배는 더 번거롭습니다.
모든 어려운 작업을 수행하지 않으려고 시도할 수 있는 단방향 솔루션은 사전 훈련된 모델을 사용하여 명시적 딥 러닝 모델을 준비할 수 있는 전문 조직을 활용하는 것입니다. 그들은 엄청난 수의 사진에 대해 훈련되고 최고의 정밀도를 위해 조정됩니다.
7. 데이터 부족
구글, 페이스북, 애플 등 주요 기업이 생성된 사용자 데이터를 비윤리적으로 사용했다는 혐의를 받고 있는 가운데 인도 등 여러 국가에서 엄격한 IT 규정을 적용해 흐름을 제한하고 있다. 따라서 이러한 회사는 이제 전 세계를 위한 응용 프로그램을 개발하기 위해 로컬 데이터를 사용하는 문제에 직면하고 있으며 이는 편향을 초래할 것입니다.
생성된 사용자 데이터의 비윤리적인 사용과 관련하여 기소를 처리하는 Google, Facebook 및 Apple과 같은 대규모 조직과 함께 인도와 같은 여러 국가에서는 데이터 흐름을 제한하기 위해 엄격한 IT 규칙을 사용하고 있습니다. 따라서 이러한 조직은 현재 주변 지역 정보를 사용하여 세계를 위한 응용 프로그램을 만드는 문제를 처리하고 있으며 이는 편향된 결과를 가져올 것입니다.
데이터는 AI의 중요한 측면이며 레이블이 지정된 정보는 기계가 학습하고 예측을 수행하도록 훈련하는 데 사용됩니다. 일부 조직에서는 새로운 전략을 개발하려고 하며 데이터 부족에 관계없이 정확한 결과를 제공할 수 있는 AI 모델 개발에 중점을 두고 있습니다. 일방적인 데이터나 편향된 정보로 인해 전체 시스템에 결함이 생길 수 있습니다.
결론
적응 가능하고 안전하며 고유한 응용 프로그램에 대한 수요가 계속 증가함에 따라 개발 커뮤니티에는 엄청난 긴장이 있습니다. 이러한 경우 AI 기술을 채택하면 기본 솔루션과 혁신을 낳을 수 있는 유리한 장소가 제공됩니다. 인공 지능과 머신 러닝은 의심할 여지 없이 프로그래밍 및 소프트웨어 개발의 미래이며, 이를 수용하는 것이 조직이 해야 할 최선의 선택입니다.
앱 개발 프로세스는 여러 활동과 이를 수행하는 전문가로 구성됩니다. 개발은 가격 요소, 개발, 도구 등과 같이 위치에 따라 AI 개발의 다양한 요소에 크게 기여합니다. 미국의 AI 개발 서비스에서 세계 다른 지역의 서비스에 이르기까지 장소에 따라 다릅니다.
AI 개발 과제 및 솔루션에 대한 FAQ
Q. 기업이 AI를 구현할 때 직면하는 문제는 무엇입니까?
기업이 비즈니스에 AI를 구현할 때 직면하는 여러 가지 문제가 있습니다. 다음은 그 중 몇 가지입니다.
- 데이터 수집 및 개선
- 스킬셋 부족
- 통합 과제
- 인프라 기능
Q. AI 개발 과제를 해결하는 방법은 무엇입니까?
AI 개발 문제에 대한 솔루션은 궁극적으로 숙련된 AI 전문가 팀과의 파트너십과 사용자 및 솔루션이 집중할 시장에 대한 이해로 귀결됩니다.
Q. AI 사용에 대한 주요 윤리적 문제는 무엇입니까?
인공 지능을 둘러싼 가장 두드러진 윤리적 문제 중 일부는 일자리 상실, 편향성, AI가 중대한 대규모 실수를 저지르는 범위, 사람들이 숨은 동기를 충족하기 위해 데이터 세트를 변조할 가능성 등입니다.