MultiMedia Modeling - 29th International Conference, MMM 2023, Bergen, Norway, January 9-12, 2023, Proceedings, Part II - researchr publication

researchr

You are not signed in
Sign in
Sign up

Duc-Tien Dang-Nguyen, Cathal Gurrin, Martha A. Larson, Alan F. Smeaton, Stevan Rudinac, Minh-Son Dao, Christoph Trattner, Phoebe Chen, editors, MultiMedia Modeling - 29th International Conference, MMM 2023, Bergen, Norway, January 9-12, 2023, Proceedings, Part II. Volume 13834 of Lecture Notes in Computer Science, Springer, 2023. [doi]

Conference: mmm2023

Abstract is missing.

Transparent Object Detection with Simulation Heatmap Guidance and Context Spatial AttentionShuo Chen, Di Li, Bobo Ju, Linhua Jiang, Dongfang Zhao. 3-15 [doi]

Deep3DSketch+: Rapid 3D Modeling from Single Free-Hand SketchesTianrun Chen, Chenglong Fu 0003, Ying Zang, Lanyun Zhu, Jia Zhang, Papa Mao, Lingyun Sun. 16-28 [doi]

Manga Text Detection with Manga-Specific Data Augmentation and Its Applications on Emotion AnalysisYi-Ting Yang, Wei-Ta Chu. 29-40 [doi]

SPEM: Self-adaptive Pooling Enhanced Attention Module for Image RecognitionShanShan Zhong, Wushao Wen, Jinghui Qin. 41-53 [doi]

Less Is More: Similarity Models for Content-Based Video RetrievalPatrik Veselý, Ladislav Peska. 54-65 [doi]

Edge Assisted Asymmetric Convolution Network for MR Image Super-ResolutionWanliang Wang, Fangsen Xing, Jiacheng Chen, Hangyao Tu. 66-78 [doi]

An Occlusion Model for Spectral Analysis of Light Field SignalWeiyan Chen, Changjian Zhu, Shan Zhang, Sen Xiang. 79-90 [doi]

Context-Guided Multi-view Stereo with Depth Back-ProjectionTianxing Feng, Zhe Zhang, Kaiqiang Xiong, Ronggang Wang. 91-102 [doi]

RLSCNet: A Residual Line-Shaped Convolutional Network for Vanishing Point DetectionWei Wang, Peng Lu, Xujun Peng, Wang-Yin, Zhaoran Zhao. 103-114 [doi]

Energy Transfer Contrast Network for Unsupervised Domain AdaptionJiajun Ouyang, Qingxuan Lv, Shu Zhang, Junyu Dong. 115-126 [doi]

Recombining Vision Transformer Architecture for Fine-Grained Visual CategorizationXuran Deng, Chuanbin Liu, Zhiying Lu. 127-138 [doi]

A Length-Sensitive Language-Bound Recognition Network for Multilingual Text RecognitionMing Gao, Shilian Wu, Zengfu Wang. 139-150 [doi]

Lightweight Multi-level Information Fusion Network for Facial Expression RecognitionYuan Zhang, Xiang Tian, Ziyang Zhang, Xiangmin Xu. 151-163 [doi]

Practical Analyses of How Common Social Media Platforms and Photo Storage Services Handle Uploaded ImagesDuc-Tien Dang-Nguyen, Vegard Velle Sjøen, Dinh-Hai Le, Thien-Phu Dao, Anh Duy Tran, Minh-Triet Tran. 164-176 [doi]

CCF-Net: A Cascade Center-Based Framework Towards Efficient Human Parts DetectionKai Ye 0004, Haoqin Ji, Yuan Li, Lei Wang, Peng Liu, LinLin Shen. 177-189 [doi]

Low-Light Image Enhancement Under Non-uniform DarkYuhang Li, Feifan Cai, Yifei Tu, Youdong Ding. 190-201 [doi]

A Proposal-Improved Few-Shot Embedding Model with Contrastive LearningFucai Gong, Yuchen Xie, Le Jiang, Keming Chen, Yunxin Liu, Xiaozhou Ye, Ye Ouyang. 202-214 [doi]

Weighted Multi-view Clustering Based on Internal EvaluationHaoqi Xu, Jian Hou, Huaqiang Yuan. 215-227 [doi]

BENet: Boundary Enhance Network for Salient Object DetectionZhiqi Yan, Shuang Liang. 228-239 [doi]

PEFNet: Positional Embedding Feature for Polyp SegmentationTrong-Hieu Nguyen Mau, Quoc-Huy Trinh, Nhat-Tan Bui, Phuoc-Thao Vo Thi, Minh Van Nguyen, Xuan-Nam Cao, Minh-Triet Tran, Hai Dang Nguyen. 240-251 [doi]

MCOM-Live: A Multi-Codec Optimization Model at the Edge for Live StreamingDaniele Lorenzi, Farzad Tashtarian, Hadi Amirpour, Christian Timmerer, Hermann Hellwagner. 252-264 [doi]

LAE-Net: Light and Efficient Network for Compressed Video Action RecognitionJinxin Guo, Jiaqiang Zhang, Xiaojing Zhang, Ming Ma. 265-276 [doi]

DARTS-PAP: Differentiable Neural Architecture Search by Polarization of Instance Complexity Weighted Architecture ParametersYunhong Li, Shuai Li 0013, Zhenhua Yu 0002. 277-288 [doi]

Pseudo-label Diversity Exploitation for Few-Shot Object DetectionSong Chen, Chong Wang 0001, Weijie Liu, Zhengjie Ye, Jiacheng Deng. 289-300 [doi]

HSS: A Hierarchical Semantic Similarity Hard Negative Sampling Method for Dense RetrieversXinjia Xie, Feng Liu, Shun Gai, Zhen Huang 0006, Minghao Hu, Ankun Wang. 301-312 [doi]

Realtime Sitting Posture Recognition on Embedded DeviceJingsen Fang, Shoudong Shi, Yi Fang, Zheng Huo. 313-324 [doi]

Comparison of Deep Learning Techniques for Video-Based Automatic Recognition of Greek Folk DancesGeorgios Loupas, Theodora Pistola, Sotiris Diplaris, Konstantinos Ioannidis, Stefanos Vrochidis, Ioannis Kompatsiaris. 325-336 [doi]

Dynamic Feature Selection for Structural Image Content RecognitionYingnan Fu, Shu Zheng, Wenyuan Cai, Ming Gao 0001, Cheqing Jin, Aoying Zhou. 337-349 [doi]

Dynamic-Static Cross Attentional Feature Fusion Method for Speech Emotion RecognitionKe Dong, Hao Peng, Jie Che. 350-361 [doi]

Research on Multi-task Semantic Segmentation Based on Attention and Feature Fusion MethodAimei Dong, Sidi Liu. 362-373 [doi]

Space-Time Video Super-Resolution 3D TransformerMinyan Zheng, Jianping Luo. 374-385 [doi]

Graph-Based Data Association in Multiple Object Tracking: A SurveyDespoina Touska, Konstantinos Gkountakos, Theodora Tsikrika, Konstantinos Ioannidis, Stefanos Vrochidis, Ioannis Kompatsiaris. 386-398 [doi]

Multi-view Adaptive Bone Activation from Chest X-Ray with Conditional Adversarial NetsChaoqun Niu, Yuan Li, Jian Wang, Jizhe Zhou, Tu Xiong, Dong Yu, Huili Guo, Lin Zhang, Weibo Liang, Jiancheng Lv. 399-410 [doi]

Multimodal Reconstruct and Align Net for Missing Modality Problem in Sentiment AnalysisWei Luo, Mengying Xu, Hanjiang Lai. 411-422 [doi]

Lightweight Image Hashing Based on Knowledge Distillation and Optimal Transport for Face RetrievalPing Feng, Hanyun Zhang, Yingying Sun, Zhenjun Tang. 423-434 [doi]

CMFG: Cross-Model Fine-Grained Feature Interaction for Text-Video RetrievalShengwei Zhao, Yuying Liu, Shaoyi Du, Zhiqiang Tian, Ting Qu, Linhai Xu. 435-445 [doi]

Transferable Adversarial Attack on 3D Object Tracking in Point CloudXiaoqiong Liu, Yuewei Lin, Qing Yang, Heng Fan. 446-458 [doi]

A Spectrum Dependent Depth Layered Model for Optimization Rendering Quality of Light FieldXiangqi Gan, Changjian Zhu, Mengqin Bai, Yingwei, Weiyan Chen. 459-470 [doi]

Transformer-Based Cross-Modal Recipe Embeddings with Large Batch TrainingJing Yang, Junwen Chen, Keiji Yanai. 471-482 [doi]

Self-supervised Multi-object Tracking with Cycle-ConsistencyYuanhang Yin, Yang Hua, Tao Song, Ruhui Ma, Haibing Guan. 483-495 [doi]

Video-Based Precipitation Intensity Recognition Using Dual-Dimension and Dual-Scale Spatiotemporal Convolutional Neural NetworkChih-Wei Lin, Zhongsheng Chen, Xiuping Huang, Suhui Yang. 496-509 [doi]

Low-Light Image Enhancement Based on U-Net and Haar Wavelet PoolingElissavet Batziou, Konstantinos Ioannidis, Ioannis Patras, Stefanos Vrochidis, Ioannis Kompatsiaris. 510-522 [doi]

Audio-Visual Sensor Fusion Framework Using Person Attributes Robust to Missing Visual Modality for Person RecognitionVijay John, Yasutomo Kawanishi. 523-535 [doi]

Rumor Detection on Social Media by Using Global-Local Relations Encoding NetworkXinxin Zhang, Shanliang Pan, Chengwu Qian, Jiadong Yuan. 536-548 [doi]

Unsupervised Encoder-Decoder Model for Anomaly Prediction TaskJinmeng Wu, PengCheng Shu, Hanyu Hong, Xingxun Li, Lei Ma, Yaozong Zhang, Ying Zhu 0002, Lei Wang 0068. 549-561 [doi]

CTDA: Contrastive Temporal Domain Adaptation for Action SegmentationHongfeng Han, Zhiwu Lu 0001, Ji-Rong Wen. 562-574 [doi]

Multi-scale and Multi-stage Deraining Network with Fourier Space LossZhaoyong Yan, Liyan Ma, Xiangfeng Luo, Yan Sun. 575-586 [doi]

DHP: A Joint Video Download and Dynamic Bitrate Adaptation Algorithm for Short Video StreamingWenhua Gao, Lanju Zhang, Hao Yang, Yuan Zhang, Jinyao Yan, Tao Lin. 587-598 [doi]

Generating New Paintings by Semantic GuidanceTing Pan, Fei Wang, Junzhou Xie, Weifeng Liu. 599-610 [doi]

A Multi-Stream Fusion Network for Image Splicing LocalizationMaria Siopi, Giorgos Kordopatis-Zilos, Polychronis Charitidis, Ioannis Kompatsiaris, Symeon Papadopoulos. 611-622 [doi]

Fusion of Multiple Classifiers Using Self Supervised Learning for Satellite Image Change DetectionAlexandros Oikonomidis, Maria Pegia, Anastasia Moumtzidou, Ilias Gialampoukidis, Stefanos Vrochidis, Ioannis Kompatsiaris. 623-634 [doi]

Improving the Robustness to Variations of Objects and Instructions with a Neuro-Symbolic Approach for Interactive Instruction FollowingKazutoshi Shinoda, Yuki Takezawa, Masahiro Suzuki, Yusuke Iwasawa, Yutaka Matsuo. 635-646 [doi]

Interpretable Driver Fatigue Estimation Based on Hierarchical Symptom RepresentationsJiaqin Lin, Shaoyi Du, Yuying Liu, Zhiqiang Tian, Ting Qu, Nanning Zheng 0001. 647-658 [doi]

VAISL: Visual-Aware Identification of Semantic Locations in LifelogLy-Duyen Tran, Dongyun Nie, Liting Zhou, Binh T. Nguyen 0001, Cathal Gurrin. 659-670 [doi]

Multi-scale Gaussian Difference Preprocessing and Dual Stream CNN-Transformer Hybrid Network for Skin Lesion SegmentationXin Zhao, Zhihang Ren. 671-682 [doi]

AutoRF: Auto Learning Receptive Fields with Spatial PoolingPeijie Dong, Xin Niu, Zimian Wei, Hengyue Pan, Dongsheng Li 0001, Zhen Huang 0006. 683-694 [doi]

In-Air Handwritten Chinese Text Recognition with Attention Convolutional Recurrent NetworkZhihong Wu, Xiwen Qu, Jun Huang 0003, Xuangou Wu. 695-707 [doi]

Multimedia Datasets: Challenges and Future PossibilitiesThu Nguyen, Andrea M. Storås, Vajira Thambawita, Steven Alexander Hicks, Pål Halvorsen, Michael A. Riegler. 711-717 [doi]

The Importance of Image Interpretation: Patterns of Semantic Misclassification in Real-World Adversarial ImagesZhengyu Zhao 0001, Nga Dang, Martha A. Larson. 718-725 [doi]

Students Take Charge of Climate CommunicationFredrik Håland Jensen, Oda Elise Nordberg, Andy Opel, Lars Nyre. 729-735 [doi]

Social Relation Graph Generation on Untrimmed VideoYibo Hu 0005, Chenghao Yan, Chenyu Cao, Haorui Wang, Bin Wu 0001. 739-744 [doi]

Improving Parent-Child Co-play in a Roblox GameJonathan Geffen. 745-750 [doi]

Taylor - Impersonation of AI for Audiovisual Content Documentation and SearchVictor Adriel de Jesus Oliveira, Gernot Rottermanner, Magdalena Boucher, Stefanie Größbacher, Peter Judmaier, Werner Bailer, Georg Thallinger, Thomas Kurz, Jakob Frank, Christoph Bauer, Gabriele Fröschl, Michael Batlogg. 751-757 [doi]

Virtual Try-On Considering Temporal Consistency for VideoconferencingDaiki Shimizu, Keiji Yanai. 758-763 [doi]

runs on WebDSL

翻译：