تهدف إلى بناء تطبيقات ذكية قادرة على فهم محتوى الصور كما يفهمها الإنسان حيث من الممكن أن تأخذ بيانات الصور عدة أشكال كالصور المتعاقبة (فيديو) المشاهد من عدة كاميرات بيانات ذات عدة أبعاد مأخوذ من جهاز تصوير طبي.من الممكن وصف الرؤية الحاسوبية باعتبارها مرادفا للرؤية الفيزيولوجية، فكما أن الرؤية الفيزيولوجية للإنسان والحيوانات المختلفة تتم دراستها للتعرف على خصائصها، فإن علم الرؤية الحاسوبية يدرس ويصف أنظمة الرؤية الصنعية التي يتم تنفيذها في البرامج أو الأجهزة. وقد أظهر التعاون بين مجالي دراسة الرؤيةالفيزيولوجية والحاسوبية تطوراً في تعميق الفهم لكلا المجالينوهي الحقل الذي يجمع الطرق لاكتساب ومعالجة وتحليل وفهم الصور ذات الأبعاد العالمية من العالم الحقيقي، وتعني ايضا وصف العالم الذي نراه في الصور وإعادة بناء خصائصه، والفكرة الأساسية من وراء هذا المجال معرفة قدرات رؤية الإنسان من خلال فهم وإدراك الصور، عن طريق تفكيكها الى معلومات رمزية من بيانات الصورة باستخدام نماذج انشئت بمساعدة علوم الهندسة والفيزياء والإحصاء ونظريات التعلم.وتهتم بمحاكاة قدرة الانسان على الرؤية بما يتضمن القدرة على التعلم والاستنتاج واتخاذ ردود افعال بناء على مدخلات بصرية، وتعد الرؤية باستخدام الحاسب أحد أفرع علم الذكاء الاصطناعي الذي يهدف عامة اليمحاكاة القدرات البشرية الذكية.والتعرف على الأشياء من المهام الأساسية ضمن مفهوم الرؤية بالحاسوب، والتي تعتمد على تحديد وتعريف هذه الاشياء سواء كانت هذه الاشياء في شكل صور او تسلسل فيديو، والبشر بطبيعتهم قادرين على التعرف على العديد من الأشياء من دون بذل الكثير من الجهد على الرغم من حقيقة أن هذه الاشياء التي توجد فيشكل صور تختلف بشكل كبير بسبب وجهات نظر مختلفة باختلاف الاحجام والاضاءة. إن النماذج التي استخدمها في رؤية الحاسوب عادة ما تكون وضعت في الفيزياء (قياس الإشعاع والبصريات، وتصميم اجهزة الاستشعار) وفي رسومات الحاسوب، ولكل مجال من هذه المجالات نموذج يوضح كيف تتحرك الأشياء والتحكم في حركتها وكيفية ينعكس وينكسر الضوء من خلال عدسات الكاميرا أو