GitHub - filipepcampos/yolomm: You Only Look Once for Multimodal Multitasking

You Only Look Once for Multimodal Multitasking

Note: This work builds upon YOLOP, please do check out that original repo.

The Illustration of YOLOMM

The changes, compared to YOLOP, are highlighted in blue. We add an extra input datum, LIDAR information and a new task, point-cloud segmentation.

Requirements

This codebase has been developed with python version 3.7, PyTorch 1.7+ and torchvision 0.8+:

conda install pytorch==1.7.0 torchvision==0.8.0 cudatoolkit=10.2 -c pytorch

See requirements.txt for additional dependencies and version requirements.

pip install -r requirements.txt

Training

You can set the training configuration in the ./lib/config/default.py. (Including: the loading of preliminary model, loss, data augmentation, optimizer, warm-up and cosine annealing, auto-anchor, training epochs, batch_size).

After that, execute the scripts present in the tools directory.

Publication

This work was published on CIARP 2023: YOLOMM – You Only Look Once for Multi-modal Multi-tasking.

@inproceedings{campos2023yolomm,
  title={{YOLOMM}--You Only Look Once for Multi-modal Multi-tasking},
  author={Campos, Filipe and Cerqueira, Francisco Gon{\c{c}}alves and Cruz, Ricardo PM and Cardoso, Jaime S},
  booktitle={Iberoamerican Congress on Pattern Recognition},
  pages={564--574},
  year={2023},
  organization={Springer}
}

Name		Name	Last commit message	Last commit date
Latest commit History 101 Commits
lib		lib
pictures		pictures
tools		tools
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

You Only Look Once for Multimodal Multitasking

The Illustration of YOLOMM

Requirements

Training

Publication

About

Releases

Packages

Contributors 2

Languages

License

filipepcampos/yolomm

Folders and files

Latest commit

History

Repository files navigation

You Only Look Once for Multimodal Multitasking

The Illustration of YOLOMM

Requirements

Training

Publication

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages