📄 Deep Tech

ArXiv 最新

Robustness/roʊˈbəstnəs/ Is a Function,/ˈfəŋkʃən/ Not a Number: A Factorized/factorized*/ Comprehensive/ˌkɑmpriˈhɛnsɪv/ Study of OOD Robustness/roʊˈbəstnəs/ in Vision-Based/visionbased*/ Driving

Amir Mallak, Alaa Maalouf 2026-02-09 cs.RO | cs.AI

Out of distribution (OOD) robustness in autonomous driving is often reduced to a single number, hiding what breaks a policy. We decompose environments along five axes: scene (rural/urban), season, weather, time (day/night), and agent mix; and measure performance under controlled $k$-factor perturbat...

查看中文翻译

自动驾驶中的分布外 (OOD) 鲁棒性通常会简化为一个数字,从而隐藏了违反策略的内容。我们沿着五个轴分解环境:场景(农村/城市)、季节、天气、时间(白天/夜晚)和代理组合;并测量受控 $k$ 因子扰动下的性能 ($k \in \{0,1,2,3\}$)。使用 VISTA 中的闭环控制,我们对 FC、CNN 和 ViT 策略进行基准测试,在冻结的基础模型 (FM) 特征上训练紧凑的 ViT 头,并在规模、多样性和时间上下文中改变 ID 支持。 (1) ViT 策略明显比同等规模的 CNN/FC 更具有 OOD 鲁棒性,并且 FM 功能以延迟成本取得了最先进的成功。 (2) 朴素时间输入(多帧)无法击败最佳单帧基线。 (3)单因素下降最大的是农村$\rightarrow$城市和白天$\rightarrow$夜间(各$\sim 31\%$);演员交换$\sim 10\%$,中雨$\sim 7\%$;季节变化可能会很剧烈,并且将时间翻转与其他变化结合起来会进一步降低性能。 (4) FM特色保单在三项同时变化下保持在$85\%$以上;非 FM 单帧策略受到较大的第一轮打击,所有非 FM 模型均通过三个变化跌至 50\%$ 以下。 (5) 相互作用是非累加性的:一些配对会部分抵消,而季节组合尤其有害。 (6) 冬季/雪地训练对于单因素变化最为稳健,而乡村+夏季基线则提供最佳的整体 OOD 性能。 (7) 缩放轨迹/视图可提高鲁棒性(从 5 美元到 14 美元轨迹,$+11.8 点),但有针对性地暴露在恶劣条件下可以替代缩放。 (8)使用多个ID环境扩大了覆盖范围并加强了弱案例(城市OOD $60.6\% \rightarrow 70.1\%$),ID下降幅度较小;单 ID 可以保持峰值性能,但范围很窄。这些结果为 OOD 稳健的驾驶策略提供了可行的设计规则。

阅读原文 →

CIC-Trap4Phish:/cictrapphish*/ A Unified Multi-Format/multiformat*/ Dataset for Phishing/ˈfɪʃɪŋ/ and Quishing/quishing*/ Attachment/əˈtæʧmənt/ Detection/dɪˈtɛkʃən/

Fatemeh Nejati, Mahdi Rabbani, Mansur Mirani 2026-02-09 cs.CR | cs.AI

Phishing attacks represents one of the primary attack methods which is used by cyber attackers. In many cases, attackers use deceptive emails along with malicious attachments to trick users into giving away sensitive information or installing malware while compromising entire systems. The flexibilit...

查看中文翻译

网络钓鱼攻击是网络攻击者使用的主要攻击方法之一。在许多情况下,攻击者使用欺骗性电子邮件和恶意附件来诱骗用户泄露敏感信息或安装恶意软件,同时危及整个系统。恶意电子邮件附件的灵活性使其成为攻击者的首选载体,因为它们可以在标准文档格式中嵌入有害内容,例如恶意软件或恶意 URL。尽管网络钓鱼电子邮件防御已经有了很大改进,但攻击者仍在继续滥用附件,使恶意内容能够绕过安全措施。此外,研究人员在训练高级模型时面临的另一个挑战是缺乏涵盖最流行数据类型的统一且全面的数据集。为了弥补这一差距,我们生成了 CIC-Trap4Phish,这是一个多格式数据集,其中包含网络钓鱼活动中常用的五个类别的恶意和良性样本:Microsoft Word 文档、Excel 电子表格、PDF 文件、HTML 页面和 QR 代码图像。对于前四种文件类型,提出了一组免执行静态特征管道,旨在捕获结构、词汇和基于元数据的指标,而无需打开或执行文件。结合 SHAP 分析和特征重要性来执行特征选择,为每种文件类型生成紧凑的、有区别的特征子集。使用轻量级机器学习模型(包括随机森林、XGBoost 和决策树)对所选特征进行评估。所有模型都表现出跨格式的高检测精度。对于基于 QR 码的网络钓鱼(quishing),实施了两种互补的方法:使用卷积神经网络 (CNN) 进行基于图像的检测,以及使用最新的轻量级语言模型对解码的 URL 进行词法分析。

阅读原文 →

ArcFlow: Unleashing/ənˈliʃɪŋ/ 2-Step Text-to-Image/texttoimage*/ Generation/ˌʤɛnərˈeɪʃən/ via High-Precision/highprecision*/ Non-Linear/nɑnˈlɪˌniər/ Flow Distillation/ˌdɪstəˈleɪʃən/

Zihan Yang, Shuyuan Tu, Licheng Zhang 2026-02-09 cs.CV | cs.AI

Diffusion models have achieved remarkable generation quality, but they suffer from significant inference cost due to their reliance on multiple sequential denoising steps, motivating recent efforts to distill this inference process into a few-step regime. However, existing distillation methods typic...

查看中文翻译

扩散模型已经实现了卓越的生成质量,但由于依赖多个连续的去噪步骤,它们的推理成本很高,这促使人们最近努力将这种推理过程提炼为几个步骤。然而,现有的蒸馏方法通常使用线性捷径来近似教师轨迹,这使得随着速度跨时间步长的变化而难以匹配其不断变化的切线方向,从而导致质量下降。为了解决这个限制,我们提出了 ArcFlow,这是一种分步蒸馏框架,它明确地采用非线性流动轨迹来近似预先训练的教师轨迹。具体来说,ArcFlow 将推理轨迹下的速度场参数化为连续动量过程的混合。这使得 ArcFlow 能够捕获速度演化并推断相干速度,以在每个去噪步骤内形成连续的非线性轨迹。重要的是,这种参数化允许对非线性轨迹进行分析积分,从而避免数值离散误差并导致教师轨迹的高精度近似。为了将这种参数化训练成几步生成器,我们使用轻量级适配器在预先训练的教师模型上通过轨迹蒸馏来实现 ArcFlow。该策略确保快速、稳定的收敛,同时保持生成多样性和质量。 ArcFlow 基于大型模型(Qwen-Image-20B 和 FLUX.1-dev)构建,仅对不到 5% 的原始参数进行微调,与原始多步教师相比,通过 2 个 NFE 实现了 40 倍的加速,而质量没有显着下降。基准实验从定性和定量两个方面证明了 ArcFlow 的有效性。

阅读原文 →