Go to documentation repository
Page History
Aby wytrenować sieć neuronową, musisz należy zebrać ( oraz udostępnić AxxonSoft ) nagrania wideo z używanych w instalacji kamer z takimi samymi warunkami pogodowymi, rozdzielczością ekranu , oraz porami dnia, co przy w przyszłym wdrożeniu sieci neuronowych.
Jeśli, dla przykładu, twoja sieć neuronowa ma być użytkowana w celu analizy obrazu na wolnym powietrzu, nagrania muszą zawierać pełen zestaw warunków pogodowych (słoneczna pogoda, deszcz, śnieg, mgła, itd.) przy różnych porach dnia (dzień, noc, zmierzch)
Ogólne wymagania dla zebranych danych:
- Przy gromadzeniu materiałów wideo upewnij się, że wymagania dla obiektów, sceny, kąta widzenia kamery, oświetlenia oraz strumienia wideo są spełnione dla narzędzia detekcji, które będzie wykorzystywane (zobacz: Konfigurowanie narzędzi detekcji).
Jeśli sieć neuronowa ma pracować w różnych warunkach oświetlenia, kąta nachylenia kamery, typach wykrywanych obiektów i pogodzie, zebrane materiały wideo dla danych warunków powinny być w równych proporcjach (podobne ilości materiałów wideo dla każdych warunków).
Info | ||
---|---|---|
| ||
Przykładowo, jeśli niezbędne jest wykrywanie osób w monitorowanym obszarze zarówno w nocy, jak i podczas dnia: Dane zebrane prawidłowo:
Dane zebrane nieprawidłowo:
|
Szczególne wymagania dla materiału wideo dla każdego narzędzia analizy neuronowej są zapisane w poniższej tabeli:
Narzędzie | Wymagania |
Filtr neuronowy | Nie mniej niż 1000 klatek zawierających wiele instancji wymaganego typu obiektu w danych warunkach , oraz taka sama długość nagrania niezawierającego obiektów (nagranie tła) |
Neurotracker | 3 do 5 minut materiału wideo zawierającego wiele instancji wymaganego typu obiektu w danych warunkach. Im większa ilość i zróżnicowanie zdarzeń na nagraniu, tym lepiej. |
Narzędzie detekcji pozycjipozy ciała | 10-sekundowe nagranie sceny niezawierające żadnych osób. Nie mniej niż 100 różnych osób uchwyconych na nagraniu w danych warunkach. Uwaga! Różne warunki oznaczają, między innymi, różne pozycje ciał osób na scenie (przechylanie się, różne wzorce ruchu kończyn, itd.). |
Sieć segmentująca narzędzia detekcji wyposażenia (PPE) | Powinna zostać utworzona lista referencyjna wyposażenia z przykładami dozwolonego wyposażenia z obiektu, uzgodniona z producentem analityk (zobacz: Przykład listy zawierającej wyposażenie wymagane na monitorowanym obiekcie). 3 do 5 minut materiału wideo zawierającego wiele instancji wymaganego typu obiektów w danych warunkach personel dla danych warunków. Osoby powinny poruszać się i zmieniać pozy ciała w zebranych nagraniach wideo, a także zakładać i zdejmować wyposażenie na co najmniej 30 sekund. |
Rozpoznawanie potraw* | Musisz udostępnić nie Nie mniej niż 80% dań w menu musi zostać udostępnionych. Każde danie wymaga 20-40 zdjęć wykonanych w różnych warunkach. |
Jeśli powyższe wymagania dla materiałów wideo zostaną spełnione, a sieć neuronowa będzie operować w warunkach tak zbliżonych, jak to możliwe do warunków w materiałach wideo, całkowita skuteczność** analityk korzystających z sieci neuronowej jest zagwarantowana na poziomie 90 - 97%, przy 5-7% fałszywych pozytywów. Dla sieci neuronowych o ogólnym zastosowaniu skuteczność jest zagwarantowana na poziomie 80-95% przy 5-20% fałszywych pozytywów.
Info | ||
---|---|---|
| ||
* Dostępne w nadchodzących wersjach oprogramowania Axxon One. ** Skuteczność dla modeli sieci neuronowych wytrenowanych do pracy przy określonych warunkach. *** Modele sieci neuronowych o ogólnym zastosowaniu to modele, które nie były wytrenowane do pracy przy określonych warunkach. |
Wymagania dotyczące trenowania sieci neuronowych mogą ulec zmianie.