V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  matrix1010  ›  全部回复第 4 页 / 共 26 页
回复总数  505
1  2  3  4  5  6  7  8  9  10 ... 26  
@xuelang 其实也是因为我没啥创意了,而且实在不爱做发布推广,比如 Hackernews 我上次发直接 dead ,发邮件问是我基本只发 Show HN 不符合规则,但我随便找一找就能找到一些也只发 Show HN 并且发的还比我多的。回邮件再问他们就不回复了
不是哥们,你这又开源又大重构的,顺手加点儿单元测试吧. 建议参考一下你自己的 CONTRIBUTING.md 里面 4. Development Guidelines 这一条
143 天前
回复了 levelworm 创建的主题 Python 怎么样才算成为这样的 Python 专家呢?
所谓专家在任何领域都差不多,最顶尖的是能作出有重大影响的开创性成果,普通专家则是解决问题能力极强。套用到 Python 上,Python 作为一种编程语言,开创性成果也许是 jit 或者解决 gil 之类的。解决问题就见仁见智了,如果你在公司能解决所有 Python 问题,那你就是公司的 Python 专家
分享创造我觉得是看有没有创意,链接什么的无所谓。比如 AI 画图基本可以说是创意为 0
146 天前
回复了 VeryZero 创建的主题 程序员 研发前花费大量精力做详细设计值得吗?
DB schema 可以自动生成,流程图要是大部分服务一样没必要画。设计重点该关心的是每个功能/需求的定制化部分。如果是非常基础的 CRUD 则没什么必要做详细设计
所谓耻辱柱的说法我见过的只有 FFmpeg 耻辱柱,但那个是违反开源协议造成的。如果你没有违反开源协议(你自己项目的协议和你引用项目的协议)那没有任问题
我刚才也 pprof 了一下你的代码,大头在 CheckEntity.Write 上。看了一眼 zap 代码其实是 1 秒内百分之一"with the same level and message in the same second, it will log every 100th entry with the same level and message in the same second." 不 sample 你的第二个应该更快一点,因为默认没有 caller
@lysShub 确实,那最好 pprof 看一下
discard 和 JSON encode 速度必然不一样。不过这个挺适合测试 LLM 的代码理解与基本逻辑能力,GPT-4o 3 次回答中 2 次都指出“sink” 应该更快 Potentially faster due to minimal overhead from discarding logs (discard:). 但 Gemini 1.5 pro 回答了 3 次全部错误,虽然他在分析代码时也指出了 discard ,但在后面推断哪个更快时直接忽略了这一点:Due to the simpler and more direct configuration in the `new` benchmark, it is **likely to be slightly faster** than the `sink` benchmark.
完全没有 context 纯引战的帖子是真没意思,BTW The language is called Go.
@DjvuLee https://ai.google.dev/gemini-api/docs/json-mode?lang=python "This approach works with both Gemini 1.5 Flash and Gemini 1.5 Pro. Since the model gets the format specification from text in the prompt, you may have some flexibility in how you represent the specification. Any reasonable format for representing a JSON schema may work."
Gemini 1.5 flash/pro 用 JSON mode ,根据我几千次的测试来看 100%返回 JSON, 大约 0.5%的情况下会出现返回数组而不是 object 的情况,不过这可能跟我的 prompt 有关。GPT 4o/4o mini 虽然我没试但应该也差不多,理论上应该更好。

估计原生支持 JSON mode 的 LLM 都没问题,针对 JSON 进行过专门优化
作为一个程序员,说慢的话最好放上数据/benchmark/测试环境/测试 SDK ,就一个截图不太合适。另外你半夜 12 点问售后工程师,人家可能只是敷衍你一下好早点睡觉
比较复杂是因为调 API 和解析返回 JSON 本身就比较复杂,header/body/超时重试/错误处理这些都要配置。当然别人配好了你用也行,就相当于 zapier 。但如果你主打手工填 API 那大概率是面向开发者,过于傻瓜反而不太合适
原创性较低的产品先发优势加良好的宣传很重要的,比如 remove bg 是 6 年前发布的产品,那时候类似的产品不多,效果不差就能有挺多流量。否则个人认为只能砸钱大量打广告,仅靠 PH 之类的宣传 1 天远远不够。而且 6 年前的 PH 和现在也不一样了,现在的 PH 感觉挺没意思,各种人为操纵排名
跟风 diss 一下 Python: "First Python version I used was 2.2. I am using Python since 2003. I cannot figure out my wife’s Python packaging issues. Skill issue." - Armin Ronacher (Creator of the Flask framework. Engineering at @getsentry)
我对项目本身挺感兴趣,网络内核,AI 应用和 Flutter 三者是如何关联起来的。能否透露一下项目具体是做什么的
169 天前
回复了 beryl 创建的主题 程序员 技术方案讨论,移除实时日志中的敏感数据
@povsister 钻牛角尖就没意思了。讨论这个问题时不应该考虑程序/代码/架构。原则就是能做到尽量做到,或者 GDPR 之类的强制你做到。做不到用户的信息就存在泄漏风险。你的系统必须要在 log 里记录真实手机/邮箱才能防止灰产,那是公司内部问题,用户不应该为此承担风险。
169 天前
回复了 beryl 创建的主题 程序员 技术方案讨论,移除实时日志中的敏感数据
@povsister 我认为在源头处理才是上策,保护用户敏感数据是企业/开发者的责任。Google 和 AWS 都有专门的服务,比如 Google 这个 https://cloud.google.com/application-integration/docs/mask-sensitive-data-logs 。开头就很明确说了为什么要这么做

Masking sensitive data in logs provides the following benefits:

Improve customer security and privacy
Comply with data privacy regulations

敏感信息处理的重点不在程序员好不好开发,而是合规并且尽可能防止数据泄漏造成的风险。
1  2  3  4  5  6  7  8  9  10 ... 26  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2701 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 07:33 · PVG 15:33 · LAX 23:33 · JFK 02:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.