最终的方案很简单啦，比我之前的代码少了一百多行，超级清爽。chatgpt功不可没（）但我真的尝试了好多方案，试了spark df的array calculation（只能做两个array之间的计算， ...